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Prefacio 


scribir un libro de métodos estadísticos. En abstracto la proposición parece 

intrascendente. Existen cientos, quizás miles de libros de texto y de consulta 

dirigidos a lectores que se inician en el estudio de esta materia. Sin embargo, 

cinco años atrás, cuando concebimos el proyecto, decidimos que era necesario. 
Primero porque los cientos o miles de libros se reducen a unas cuantas docenas si 
restringimos el campo a los escritos originalmente en español o a los traducidos, aun 
considerando aquellos en que la traducción produjo versiones que solo con la mejor 
voluntad pueden asociarse con algún dialecto lejanamente emparentado con nuestro 
idioma. Segundo, porque varios de los libros traducidos parecen haber sido seleccionados 
más con criterios circunstanciales o de comercio que didácticos. Y tercero, pero no por eso 
menos importante, porque creímos tener algo que decir sobre el orden, la profundidad y 
la manera de exponer los conceptos estadísticos básicos. 


De la escasez de libros escritos en (o traducidos al) español hay poco que decir. Vale 
abundar en el tercer punto. Nuestra premisa original fue que los métodos estadísticos 
pueden exponerse y fundamentarse de manera comprensible para lectores con poco 
entrenamiento matemático. En consecuencia, intentamos escribir un libro cuyo 
contenido fuese no sólo aplicable, sino entendible, por los estudiantes de preparatoria 
con alguna inclinación matemática, y por cualquier estudiante de licenciatura. Aunque 
algunos conceptos requieren cierta madurez de pensamiento para su comprensión cabal, 
tratamos de exponerlos con claridad, y sin pretender disimular dificultad implícita. En 
suma, sin sacrificar las necesidades inmediatas del lector, subrayamos la importancia de 
que se comprendan los métodos descritos, bajo el supuesto de que a veces es preferible 
no usar estadística que usarla mal. De la premisa fundamental se desprenden los cambios 
sustantivos —con respecto a otros libros— que seguramente notarán los estudiantes más 
avanzados y los profesores que usen el libro como texto. Como ejemplo de estos cambios 
citamos los siguientes: la introducción temprana de distribuciones empíricas conjuntas de 
variables aleatorias y de las medidas descriptivas de asociación entre ellas; el poco uso de 
la probabilidad a priori, y en consecuencia el abandono de los ejemplos prototípicos de 
barajas, dados y monedas; la disminución aparente del capítulo dedicado a la probabilidad 
en favor de los destinados a variables aleatorias y a modelos probabilísticos; la constante 
homologación entre medidas descriptivas y parámetros; la presentación del análisis de 
varianza como una técnica alternativa pero no única; y una larga cauda de etcéteras que 
las limitaciones de espacio nos impiden exponer. 


En el largo proceso de escribir este libro, nuestra perspectiva ha variado. Planeado para 
un curso introductorio, el material que presentamos sólo puede cubrirse con holgura en 


dos semestres. Para un curso introductorio de un semestre (54 horas de teoría y 18 de 
práctica) sugerimos los siguientes capítulos y secciones: capítulos 1, 2, 3 y 4 completos, 
excepto por la sección 4.7; 5.1, 5.2, 5.4, 5.5, 5.7, 5.8, 5.9; 6.1, 6.3, 6.4, 6.5, 6.10, 6.11, 
6.12, todo el capítulo 7, excepto la sección 7.7; 8.1, 8.2, 8.3, 8.5, 8.6, 8.9; 9.1, 9.2, 9.3, 
9,4, 95, 9:6, 9.8, 9.9, 9,11; 10.1, 10.2, 10.3, 10.4 y 10.5; 12.1, 12.2, 12,3, 124 y 12.5. 
La parte sustancial de un segundo curso puede integrarse como sigue: secciones 6.13, 7.7, 
8.7, 9.7, 10.6, 10.7, capítulo 11, secciones 12.6 a 12.15 y capítulo 13. 


Pero no sólo la cantidad de material es superior a la proyectada originalmente, sino 
también, en algunos casos, la profundidad. Así ocurre por ejemplo con los capítulos 5, 6, 
8, 10 y 11. El resultado final es un libro que, con diferentes selecciones de material, puede 
usarse en cursos de licenciatura y de maestría. Se incluyen 206 ejemplos resueltos en detalle 
y una sección de ejercicios al final de cada capítulo: 321 ejercicios en total. Los ejemplos 
y los ejercicios han sido seleccionados de los más variados campos del conocimiento, y en 
el caso de los ejercicios a menudo se han usado para extender ideas expuestas en el texto 
o para introducir material nuevo. Cuando ocurre lo último se ha escrito entre paréntesis, 
al principio del ejercicio, el tema que se trata. El final de cada ejemplo se señala con el 
símbolo 0, para separar los comentarios que sólo son aplicables a ese ejemplo del discurso 
general. Éstas son las aclaraciones, los hipotéticos lectores juzgarán los resultados. 


Finalmente la difícil —por comisión u omisión— tarea de reconocer las deudas. Por más 
de diez años hemos ensayado múltiples maneras de exponer este material a auditorios 
disímiles. De esa experiencia —y de las meditaciones y discusiones posteriores— resultan, 
después de cinco años de trabajo, estas 600 y tantas páginas que ahora presentamos 
sistematizadas y encuadernadas en un paquete posiblemente vendible y seguramente 
criticable. En el camino hemos contado con la impagable tolerancia de nuestros 
alumnos, principalmente del Colegio de Postgraduados y de la Universidad Autónoma 
Chapingo. De primordial importancia ha sido el apoyo de las autoridades del Colegio 
de Postgraduados, y en especial de las del Centro de Estadística y Cálculo, donde la 
generosidad de Alfonso Carrillo Liz alentó el proyecto como propio. 


Otros agradecimientos: a nuestros compañeros profesores del Centro de Estadística 
y Cálculo, que han propiciado un ambiente de libertad y excelencia académica; a 
Alejandro Serrano Muñoz, que generó las tablas y, finalmente, a las dos personas que 
más trabajaron para hacer posible este libro: Carmen Monsalvo y Esperanza Salinas, 
quienes pacientemente hicieron la transcripción mecanográfica de las diferentes versiones 
preliminares y de la definitiva. 


Tantas omisiones, tantos desencuentros, ameritarían un capítulo especial. A todos, los 
mencionados y en especial a algunos de los omitidos, nuestro testimonio de gratitud, la 
rosa blanca de Martí, la mano franca. 


Chapingo, Méx., a 4 de noviembre de 1983. 


Said Infante Gil 
(saidecolpos.mx) 


Guillermo P Zárate de Lara 
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Introducción 


1.1. Idea popular sobre la estadística 


Como se desprende de la definición anotada arriba, la acepción más difundida de la palabra Estadística está 
íntimamente ligada a las actividades de recuento y enumeración que tradicionalmente han sido realizadas por 
el Estado con diversas finalidades: conocer el número de habitantes de un país o región; registrar los volúmenes 
de cosecha de productos agrícolas; disponer de un padrón para el cobro de impuestos, etc. En estas condiciones 
no es sorprendente que para el público en general, y aun para el estudiante que se inicia en la materia, ésta se 
encuentre asociada con grandes (y tediosas) listas de números cuya sola extensión los vuelve incomprensibles. 
Si bien este es uno de los aspectos de la Estadística, ciertamente no es el único y en la concepción moderna 
de la disciplina tampoco el más importante. Este capítulo introductorio tiene como objetivo presentar, de la 
manera más amplia posible, los múltiples usos que las técnicas estadísticas tienen en la ciencia moderna, en la 
administración, en la toma de decisiones y aun en la vida cotidiana de cualquier persona. 


1.2. La estadística y el manejo de datos 


En el párrafo anterior se ha mencionado que la connotación usual de la palabra Estadística la relaciona 
con grandes conjuntos de números que se han recolectado con un fin determinado. Las primeras técnicas 
estadísticas consistían esencialmente en la organización de estos datos, en su presentación gráfica y en el cálculo 
de cantidades “representativas” del conjunto, con el objeto de que los aspectos sobresalientes del mismo fueran 
rápida y fácilmente aprehensibles. Esta parte de la materia es lo que, en la terminología moderna, se conoce 
como Estadística Descriptiva. A pesar de que su importancia relativa ha disminuido recientemente, es indudable 
que este aspecto de la disciplina tiene una utilidad considerable, y los dos capítulos siguientes estarán dedicados 


a presentar las técnicas más usuales de la Estadística Descriptiva. 


La parte más antigua de la Estadística está integrada por un conjunto de técnicas para la organización, 
presentación gráfica y cálculo de cantidades “representativas” de un grupo de datos. Esta parte de la 
Estadística recibe el nombre de Estadística Descriptiva. 


Merooos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


1.3. Estadística e incertidumbre 


Si la Estadística Descriptiva ha visto reducida su importancia, esto se debe en parte a que muy a menudo la 
información de que se dispone es incompleta. Para continuar con los ejemplos del apartado 1.1: el aumento 
desorbitado de la población y el incremento de las áreas de cultivo han vuelto muy costoso, cuando no 
imposible, levantar censos exhaustivos que nos proporcionen una información completa. De manera que 
es cada vez más frecuente que ésta sea colectada sólo en una fracción de la población o de los productores. 
En estas condiciones, las técnicas de la Estadística Descriptiva se vuelven de utilidad limitada, puesto que 
disponiendo de información sólo sobre una parte del todo queremos extrapolar nuestras conclusiones hacia 
un conjunto mayor que es objeto de nuestro interés. Por ejemplo, es común que estemos interesados en 
saber la producción de maíz por hectárea en una región, pero nuestros recursos económicos nos permiten 
entrevistar sólo a 100 de los (digamos) 1000 agricultores de la zona. Cualquier conclusión a la que lleguemos 
contendrá elementos de incertidumbre, puesto que no es imposible que hayamos entrevistado a los 100 
peores (o mejores) agricultores, y en consecuencia nuestras afirmaciones, basadas en los datos disponibles, 
subestimarán (o sobreestimarán) la producción verdadera de maíz. 


Esta incertidumbre es inherente a cualquier proceso en que se extienden conclusiones hacia un conjunto mayor 
que aquél sobre el que se tiene información. El método de razonamiento que nos conduce a esta extensión es 
conocido como inductivo. Por inducir (del latín inducere) se entiende en lenguaje cotidiano: ascender lógicamente 
el entendimiento desde el conocimiento de los fenómenos, hechos o casos, a la ley o principio que virtualmente los 
contiene o que se efectúa en todos ellos uniformemente. Para nuestros propósitos será suficiente caracterizar al 
método inductivo como un proceso lógico que va de lo particular a lo general; por oposición al método 
deductivo, en el que se procede lógicamente de lo general a lo particular. 


Este proceso inductivo es inseparable de cualquier rama del conocimiento científico y forma parte, además, 
de la herramienta con que cualquier individuo, científico o no, se enfrenta a los hechos objetivos del mundo 
que lo rodea. Nuestras opiniones, actitudes y, por supuesto prejuicios, están, por regla general, basados en 
información incompleta. Consideremos el generalizado concepto popular según el cual los médicos tienen una 
escritura ilegible. Cuando expresamos lo anterior no queremos decir que hemos examinado la escritura de todos 
los médicos y comprobado que es ilegible; simplemente estamos afirmando que algunos médicos (quizá todos 
los que conocemos) comparten esa característica común y, en consecuencia, estamos extrapolando nuestras 
observaciones hacia toda la profesión médica. Es claro que no es imposible que si examinamos la escritura de 
más individuos encontremos algunos médicos para los cuales nuestra aseveración es falsa. Tenemos presente 
aquí, entonces, esa incertidumbre que mencionamos líneas arriba como típica de las conclusiones obtenidas 
mediante el proceso inductivo. 


Desde luego, no sólo el hecho de disponer de información incompleta es fuente de incertidumbre. A menudo 
la misma experiencia realizada repetidas veces arroja resultados diferentes. Esto es fácilmente comprobable si, 
por ejemplo, hacemos mediciones repetidas de la misma persona, o si tratamos de determinar el rendimiento de 
una variedad de maíz sembrándola varias veces. Para el investigador en el área biológica es especialmente claro 
que vivimos en un mundo sumamente variable y que de hecho esta variabilidad es benéfica desde el punto de 
vista de la adaptabilidad de los seres vivos a su medio ambiente. Para el genetista, una característica indeseable, 
la vulnerabilidad, se presenta cuando una población es muy uniforme en su carga genética. Sin embargo, esta 
variabilidad, que es tan deseable desde el punto de vista adaptativo, introduce el elemento de incertidumbre en 
el proceso inductivo que, a partir de hechos aislados, pretende “... (encontrar) la ley o principio que virtualmente 
los contiene o que se efectúa en todos ellos uniformemente”. 
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INTRODUCCIÓN 


A estas alturas de la discusión cabe preguntar lo siguiente: si este proceso inductivo es característico de 
sudas las disciplinas científicas y aun del razonamiento cotidiano, ¿qué relación especial tiene con la 
Estadística? La respuesta es muy simple y quizá en este capítulo introductorio peque aun de simplista: el 
papel de la Estadística en este proceso es cuantificar la incertidumbre que es inseparable de las conclusiones 
abrenidas por su intermediación. Esta cuantificación se logra mediante el uso de los conceptos y técnicas 
de la Probabilidad, a cuyo estudio dedicaremos el capítulo de este libro. Armados con estos conceptos, nos 
será posible desarrollar los métodos estadísticos de naturaleza inductiva que, cuando se complementan con 
los principios probabilísticos mencionados, integran la rama de la Estadística conocida como /nferencia 


Enxadística o Estadística Inductiva. 


1.4. La estadística y el método científico 


En los apartados precedentes se ha esbozado el papel que juega la 
Estadística en la presentación y organización de datos y en el proceso 
inductivo. Vale anotar que cualquier caracterización que se haga 

del conjunto disponible de datos involucra, necesariamente, un 
razonamiento de tipo deductivo, mientras que la generalización de las 
conclusiones se hace vía inducción, de manera que los dos tipos de 
razonamiento lógico aparecen mezclados en la metodología estadística. 
Quizá el mejor ejemplo de esta dualidad, así como de la gran aplicabilidad 
de la disciplina, se dé al situarla en relación con lo que llamamos el Método 
Científico. Antes de proceder a caracterizar al método científico, conviene 
señalar que lo que a continuación se dirá es válido para las ciencias que 


llamaremos empíricas, tales como la Biología y la Física experimental, y no MA P 
necesariamente para las ciencias analíticas tales como la Matemática, que / 

son de naturaleza completamente deductiva. El matemático puro establece 

la validez de un teorema a partir de un conjunto de axiomas, sin recolectar / os 


información para “demostrar” su aserto. 


En un sentido amplio podemos definir Ciencia como: un cuerpo de doctrina sistematizado que constituye un 
ramo particular del saber humano. Lo que llamamos método científico es un intento de explicar los hechos 
Ésicos, biológicos, y aun de la conducta humana, sin la mediación de la magia, dioses, o fuerzas sobrenaturales. 
El gérmen de la idea nació en Jonia en el siglo VI a.C., y terminó en el V d.C. En Alejandría destacó Hipatia, 
primera mujer matemática, hija del astrónomo Teón, que destacó como filósofa (neoplatónica) y astrónoma. 
Nuestro interés se centrará, sin embargo, en la acepción moderna del término, la cual, como casi todas las 
percepciones actuales sobre el mundo físico, empieza a conformarse en el siglo XVI con la revolución científica 
iniciada por cuatro grandes hombres: Johannes Kepler (1571-1630), Galileo Galilei (1564-1642), Isaac Newton 
(1642-1727) y Nicolas Copernicus (1473-1543). Este último, aun perteneciendo al siglo XVI, tuvo su mayor 
influencia en el siglo XVII. 
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En este contexto, la definición anterior sigue siendo válida, sólo que nos es posible caracterizar al método de 
manera más precisa. Se ha dicho que los fundadores de la ciencia moderna tenían dos méritos que difícilmente 
se encuentran juntos: una inmensa paciencia para observar hechos y una gran audacia para formular hipótesis. 
El segundo de estos méritos perteneció a los más antiguos filósofos griegos y el primero se dio, en grado 
considerable, en los últimos astrónomos de la antigiiedad. Pero ninguno de los antiguos, excepto quizá 
Aristarco, poseía ambos. En el párrafo anterior se mencionan dos de los tres aspectos más importantes del 
método científico: la formulación de hipótesis que expliquen hechos del mundo que nos rodea y la toma de 
observaciones que apoyen o invaliden esas hipótesis. El tercer aspecto, que se encuentra implícito en los dos 
anteriores, consiste en la confrontación de las observaciones con las consecuencias deducibles de las hipótesis 
postuladas. En general, el proceso no termina con la aceptación (provisional) o el rechazo de la(s) hipótesis, 
sino que la confrontación nos conduce a hipótesis modificadas, de las cuales deducimos consecuencias que 
deberán verificarse con nuevas observaciones. 


A continuación se describe el papel de la Estadística en los diversos aspectos del método que hemos caracterizado 
previamente. 


a) Formulación de hipótesis: ésta es la parte más difícil del trabajo científico y a menudo requiere gran 
habilidad. Sir Francis Bacon (1561-1626), el fundador del método inductivo moderno, pensaba que 
la mera organización de los datos debería sugerir la hipótesis obvia. Sin embargo, esto pasa raras veces, 
ya que es más frecuente que sea necesaria una hipótesis preliminar para la obtención de datos que sean 
relevantes al problema. De cualquier modo, en algunas ocasiones las técnicas de la Estadística Descriptiva 
pueden sugerir hipótesis apropiadas. 


b) Obtención de datos: en este aspecto del método el papel de la Estadística es crucial. Se trata de adquirir 
información de manera que: 1) la información sea relevante al problema y 2) las conclusiones que de 
ella se extraigan tengan cierto grado de confiabilidad. La cantidad de información necesaria, la forma 
de recolección y las técnicas para adquirirla, de manera que se cumplan los dos objetivos anotados, son 
todos problemas en el dominio de los métodos estadísticos. Las ramas de la Estadística que tratan estos 
problemas reciben el nombre de Diseño de Experimentos y Muestreo Estadístico. 


c) Confrontación de la información obtenida con las consecuencias de las hipótesis postuladas: una vez 
obtenidos los datos, el papel de la Estadística se vuelve aún más importante, puesto que llega el 
momento de analizarlos. El primer paso en este análisis consiste en la organización de los mismos, 
en su presentación gráfica y en su descripción, resaltando sus aspectos más característicos; en otras 
palabras, en el uso de las técnicas de la Estadística Descriptiva. La segunda y más importante parte del 
análisis, que se apoya en la primera, tiene por objeto tratar de generalizar esos aspectos característicos 
de la información y examinar su compatibilidad con las consecuencias de la(s) hipótesis que se 
sustentan. Puesto que la información será incompleta o reflejará la variabilidad del fenómeno que 
se observa, la generalización irá acompañada de un grado de incertidumbre que es cuantificable 


mediante principios probabilísticos. Estamos, pues, en el área de interés de la Inferencia Estadística 
o Estadística Inductiva. 


Antes de finalizar esta sección conviene destacar que la Teoría de la Probabilidad es una provincia de la matemática 
pura, la cual es una ciencia analítica y, en consecuencia, enteramente deductiva. Esto nos hace patente que, en 


cualquier investigación científica, los razonamientos deductivo e inductivo se encuentran indisolublemente 
ligados, interactuando el uno sobre el otro. 
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1.5. Una definición de Estadística 


Después de la discusión de las secciones previas proponemos (más bien con propósitos operativos que con ánimo 
totalizador) una definición de Estadística que intentamos sea de utilidad para el estudiante que se aventura 
por primera vez en el estudio de esta materia. Podemos decir que Estadística es un conjunto de técnicas para la 
recolección, manejo, descripción y análisis de información, de manera que las conclusiones obtenidas de ella tengan un 


grado de confiabilidad especificado. 
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capítulo 


Métodos tabulares y gráficos para 
la organización y presentación de datos 


2.1. Introducción 


En el capítulo anterior se señaló que la connotación usual de la palabra Estadística está asociada con la recolección 
de grandes conjuntos de datos con un fin determinado. Se mencionó también que, una vez obtenidos los datos, 


fi 


| problema que surge inmediatamente es el de interpretar correctamente los mismos. Lo anterior nos indica la 
necesidad de disponer de métodos que nos permitan organizar y presentar las observaciones de tal forma que 

s aspectos más sobresalientes de las mismas sean rápida y fácilmente aprehensibles. Los métodos empleados 
deberán poseer características que nos faciliten alcanzar los objetivos mencionados. Entre las propiedades que 


podemos anotar se tienen, entre otras: 
que proporcionen la máxima información contenida en los datos en forma rápida y fácil de visualizar. 
b) que posean sencillez operativa. 
c) que permitan presentar los datos de una manera estética. 


s métodos para describir conjuntos de datos integran la Estadística Descriptiva y se pueden categorizar 
en: métodos tabulares y gráficos y métodos numéricos. En este capítulo nos referiremos sólo a algunos métodos 
tabulares y gráficos, los cuales poseen las características anotadas y son útiles no sólo desde el punto de vista 
descriptivo, sino que además sugieren ideas y conceptos que servirán como punto de apoyo a la Estadística 


Inductiva. 


Los métodos tabulares y gráficos nos permiten organizar y presentar datos de forma tal que los aspectos 


sobresalientes de los mismos sean rápida y fácilmente aprehensibles. En ocasiones estos métodos nos 
ayudan a establecer hipótesis tentativas sobre la naturaleza del fenómeno que se estudia. — 


a. 
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2.2. Métodos tabulares para organizar conjuntos de datos 


Es bastante común que en muchos reportes, 
así como en revistas y periódicos, los datos se 


ya sean científicos, 
presenten por medio de tablas. La que sobresale por su sencillez 


de negocios o de la administración pública, 


y claridad es aquélla que consta únicamente de dos encabezados (columnas) y que se ilustra con los siguientes 


ejemplos: 


Ejemplo 2.1. A continuación se presenta en forma tabular el 
algunas dependencias gubernamentales durante el año de 1975. 


número de empleados del sexo masculino en 


Tabla 2.1. Número de empleados del sexo masculino en algunas depen- 


dencias gubernamentales. 


Dependencia Total de hombres empleados 
Secretaría de Educación Pública 135716 


Secretaría de Marina 

Secretaría de Obras Públicas 
Secretaría de Recursos Hidráulicos 
Secretaría de Salubridad y Asistencia 
Secretaría de la Reforma Agraria 


Fuente: Censo de Recursos Humanos del 
nistración Central. 1975. 


19 443 
35 444 
53 725 
28 851 

6 680 


Sector Público Federal. Admi- 


que entre las Secretarías de Estado en consideración, 
la de Educación Pública, y la que menos empleó fue la de la Reforma Agraria. € 


Ejemplo 2.2. En la Tabla 2.2 se presentan las calificaciones obtenidas 
final de la cátedra de Experimentación Agrícola, llevado a cabo en la 


por un grupo de estudiantes en el examen 
Universidad Autónoma de Chapin o. 
Ping 


Tabla 2.2. Calificaciones obtenidas 
mentación Agrícola. 


por un grupo de estudiantes en el examen final de la cátedra de Experi- 


31 52 58 60 66 67 69 70 75 83 
88 89 91 93 96 57 61 74 76 61 
57 64 68 74 64 Z 87 62 85 80 
68 76 80 82 71 85 62 72 72 82 
71 87 73 72 79 84 81 79 81 73 


el número de estudiantes 
ésto puede hacerse en una tabla con dos encabezados (Tabla 2.3). 


que obtuvieron una determinada calificación, 


En general, este tipo de tablas nos permite exhibir en forma concisa el número de veces que se presenta una 
determinada cantidad en un conjunto de datos. 4 
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Tabla 2.3. Frecuencias de estudiantes que 
obtuvieron una calificación dada en un 
examen de la cátedra de Experimentación 


Agrícola. 


Calificación Número de estudiantes 


31 
52 
57 
58 
60 
61 
62 
64 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
ned 
79 
80 
81 
82 
83 
84 
85 
87 
88 
89 
91 
93 
96 
Total 
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mo 
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La utilidad de este tipo de presentación es máxima cuando el número de datos es pequeño y se acompaña la tabla 
con algún texto que indique el tipo de observaciones de que se trata. 


Una forma de presentación que será muy útil para nuestros propósitos es el que resulta de organizar los datos 
en Tablas de Frecuencias o Tablas de Distribución de Frecuencias. En este tipo de tablas se divide la amplitud de 
los valores numéricos de los datos en un cierto número de Intervalos o Clases, y se cuenta las observaciones que 
pertenecen a cada una de ellas. 
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Para ilustrar la construcción de tablas de frecuencias considérense los datos de la Tabla 2.4. 


Tabla 2.4. Rendimiento (en kilogramos) de plantas de maíz atacadas por el barrenador europeo. 


3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 
7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64 8.82 10.08 5.64 
8.26 7.90 10.27 6.65 7.25 6.26 6.43 7.71 7.32 6.68 7.98 
7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 

10.34 6.91 7.82 6.76 TTD 7.36 8.52 7.23 7.63 6.95 7.78 
6.65 6.86 7.74 6.67 7-12 4.00 7.10 


Datos: Cortesía del Doctor Jorge Vera Graziano. 


Los primeros problemas que tenemos que afrontar son los de decidir cuántas clases deberán establecerse y si éstas 
tendrán o no la misma anchura. Es práctica común utilizar entre 5 y 20 clases, y normalmente resulta conveniente 
construirlas de modo que todas las clases tengan la misma anchura, la cual recibe el nombre de Intervalo de Clase. 


Este último requerimiento no es inflexible, y algunas veces se emplea diferentes anchuras o intervalos de clase. 


En este caso optaremos por 9 clases, todas ellas con igual intervalo de clase. La siguiente pregunta por responder 
se refiere a la determinación del Intervalo de Clase. Para responderla, se calcula la diferencia entre el mayor y 
menor valor numérico de los datos, que para nuestro ejemplo resulta ser 10.34—3.81=6.53. Esto nos indica 
que la suma de los intervalos de clase deberá cubrir al menos esta diferencia. Si optamos por un intervalo de clase 
de 0.8, y si elegimos como límite inferior de la primera clase el número 3.8, la última clase tendrá como límite 
superior el valor de 11.0, lográndose de esta manera que todos los datos estén cubiertos por las clases. Nótese que 
una vez escogidos los intervalos de clase y el límite inferior de la primera clase, los límites de las clases restantes 
quedan perfectamente definidos. 


Para prevenir ambigúedades en cuanto a la clase a la que pertenece cierto número, diremos que un dato pertenece 
a una determinada clase si su valor numérico es estrictamente mayor que el límite inferior y menor o igual que el límite 
superior. Así, por ejemplo, nuestra primera clase con una anchura de 0.8 es: 


3.8— 4.6, 


a 
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el límite superior es 4.6 y el inferior 3.8, de tal forma que el dato 3.81 pertenece a la clase porque está comprendido 
entre 3.8 y 4.6, esto es 3.8<3.81<4.6. Por otro lado, el número 3.8. (en el supuesto caso que formase parte de 
nuestros datos) no pertenecería a la clase, ya que no es estrictamente mayor que el límite inferior; sin embargo, 
el punto 4.6 sí sería miembro de la clase pues es igual al límite superior. 


Otra forma de evitar ambigiedades consiste en elegir como límites de las clases, valores que no estén presentes en 
el conjunto de datos. Esto se logra asignando a los límites de clase una mayor aproximación decimal que la que 
poseen las observaciones. Para nuestro ejemplo, los datos tienen aproximación a centésimas, de tal forma que 
los límites de los intervalos pueden elegirse con una aproximación a milésimas, de modo que la primera clase 


podría ser: 
3.805— 4.605. 


Obsérvese que el intervalo de clase aún es 0.8. 


Aplicando lo antes descrito tendremos que las clases son: 


Tabla 2.5. Clases o intervalos para los 
datos presentados en la tabla 2.4. 


Clases o intervalos 
(3.8, 4.6] i 
(4.6, 5.4] 
(5.4, 6.2] 
(6.2, 7.0] 
(7.0, 7.8] 
(7.8, 8.6] 
(8.6, 9.4] 
(9.4, 10.2] 
(10.2, 11.0] 
*La notación (ab), con a<b, 
indica que la clase incluye números 
estrictamente mayores que 4 y menores 
o iguales que b. 


Es conveniente elegir un número que represente a cada una de las clases. Comúnmente se elige el punto central, 
que se denomina Valor Medio de Clase, el cual se obtiene dividiendo la suma de los límites de clase entre dos. 
Así, para la primera clase de la Tabla 2.5, el valor medio de clase será: 


4.643.8 _ 
2 


4.2 


Usaremos la letra v para representar el valor medio de clase, con un subíndice que nos indique de qué clase 
P P q q q 

se trata. Así, para la clase 1, el valor medio de clase se representará por v, para la segunda por v,, etc. En 

general, v) es el valor medio de la ¡-ésima clase. Adoptaremos una convención similar para las frecuencias 


usando la letra f 


T 
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A continuación se muestran los intervalos y los puntos medios de clase para nuestro ejemplo. 


Tabla 2.6. Intervalos y valores medios de clase para los 
datos presentados en la Tabla 2.4. 


Intervalos Valor melo dedike E 
(3.8, 4.6] y =42= 3.8+4.6 
(4.6, 5.4] »,=5.0= 4.6 t 5.4 
(5.4, 6.2] v, =5.8 
(6.2, 7.0] v, = 6.6 
(7.0, 7.8] v =74 
(7.8, 8.6] y, =8.2 
(8.6, 9.4] v, =9.0 

(9.4, 10.2] 1, =9.8= 9.4 t 10.2 

(10.2, 11.0] n=10.6= 110 
A 


El siguiente paso en la construcción de la tabla es llevar a cabo el conteo del número de observaciones que 
pertenecen a cada clase. Este número es llamado frecuencia absoluta de clase (£,). También resulta conveniente 
calcular las frecuencias relativas de clase (p,); estas últimas indican qué proporción del total de observaciones 
pertenece a cada clase. Para calcularlas, se divide la frecuencia absoluta entre el total de observaciones (total de 
frecuencias absolutas). Así, para el ejemplo en cuestión, a la primera clase le corresponde una frecuencia absoluta 
de 4, pues solamente los números 3.81, 4.56, 3.86 y 4.0 pertenecen a ella. La correspondiente frecuencia relativa 
es 4/73, donde 73 es el número total de observaciones. En la Tabla 2.7 se presentan los intervalos, las frecuencias 
absolutas y las frecuencias relativas. 
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Tabla 2.7. Intervalos, frecuencias absolutas y frecuencias relativas de clase, para los 
datos presentados en la Tabla 2.4. 


A A A 
Intervalos Frecuencias absolutas (f,) Frecuencias relativas ( p,) 
(3.8, 4.6] f=4 pı = 4/73 
(4.6, 5.4] f= p= 1/73 
(5.4, 6.2] f=7 p3=7173 
(6.2, 7.0] fi=19 p4= 19/73 
(7.0, 7.8] f£=20 ps = 20/73 
(7.8, 8.6] f= ps = 9/73 
(8.6, 9.4] f£=10 p= 10/73 
(9.4, 10.2] f= ps = 1/73 
(10.2, 11.0] = = 2173 
Total 73 73/173 = 1 


Resulta conveniente adicionar a la tabla de frecuencias información sobre el número de datos cuyo 
valor numérico es menor o igual que el límite superior de cada clase; este número recibe el nombre de 
frecuencia acumulada. Estas frecuencias pueden calcularse usando las frecuencias absolutas o relativas, lo 
que da origen respectivamente a lo que llamamos frecuencias acumuladas absolutas y frecuencias acumuladas 
relativas. En seguida ilustraremos el cálculo con las frecuencias relativas, siendo para las absolutas el mismo 
procedimiento. En la Tabla 2.7 se puede observar que existen 4 datos de 73, cuyo valor numérico es menor 
o igual que el límite superior de la primera clase; por lo tanto, la frecuencia acumulada para esta clase es de 
4/73. Existen 4+1=5 observaciones de 73, cuyo valor numérico es menor o igual que el límite superior 
de la segunda clase; por lo tanto, la frecuencia acumulada relativa que le corresponde es de 5/73. Este 
procedimiento continúa hasta determinar qué proporción de datos existe, cuyo valor es menor o igual que 
el límite superior de la última clase, lo que nos dará la última frecuencia acumulada relativa, cuyo valor es 
siempre de uno. 


La Tabla 2.8 contiene los intervalos, frecuencias acumuladas absolutas y relativas para los datos de la Tabla 
2.4. 


La tabla que resume la información presentada en las Tablas 2.5, 2.6, 2.7 y 2.8 recibe el nombre de Zabla de 
Frecuencias (Tabla 2.9). 


Todos los pasos necesarios para la construcción de una tabla de frecuencias se detallan a continuación: 


1. Elección del número de clases. Es arbitraria; comúnmente se establecen de 5 a 20 clases, dependiendo del 
número de datos. 
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2. Cálculo del intervalo de clase. Se obtiene la diferencia entre el mayor y el menor valor numérico de 
los datos, la cual nos indicará la distancia mínima que debe cubrir la suma de los intervalos de clase. 
Esa distancia o un número ligeramente mayor, dividido entre el número de clases nos da el intervalo 
de clase. 


Tabla 2.8. Intervalos, frecuencias absolutas y frecuencias relativas de clase, para los datos en la Tabla 2.4. 


Frecuencias relativas Frecuencias acumuladas Frecuencias acumuladas 
Intervalos K 
(p,) relativas (f.) absolutas 
¿A A RANES a o EIA O 
(3.8, 4.6] 4/73 4173 4 
4 1 S 
6, 5. 1/ —t+t= == 
(4.6, 5.4] 73 37377 5 
5 7 R 
4, 6. A 
(5.4, 6.2] 7173 2377 12 
12,19 31 
6.2, 7.0 19/ pde E A 
(6.2, 7.0] 9/73 33 7 31 
31 20 51 
.0,7. 2 += 
(7.0, 7.8] 0/73 33 7 51 
JL. Q OQ 
.8,8. AE E a 
(7.8, 8.6] 9/73 337 60 
60 10 70 
8.6, 9.4 10/ —+—=— 
(86.2.4 ds 73 73 73 q 
70 1 71 
.4, 10.2 1/ se 
0.4 ds 73 73 p x4 
Al Z- Jo 
0.2, 11. E CN EA 
(10.2, 11.0] 2/73 33 7 73 


—_———__—___ ______—____<>>>S-5->->—_ a e ++ + + + + + + + +1 


Tabla 2.9. Tabla de frecuencias para los datos de la Tabla 2.4. 


Clase o Punto o valor Frecuencia Frecuencia gut Frecuencia 
6 : : acumulada acumulada 
intervalo medio de clase (v,) absoluta (f,) relativa ( p,) relativa (E prin 

(3.8, 4.6] 4.2 4 4/73 4/73 4 
(4.6, 5.4] 5.0 1 1/73 5173 5 
(5.4, 6.2] 5.8 7 7173 12/73 12 
(6.2, 7.0] 6.6 19 19/73 31/73 31 
(7.0, 7.8] 7.4 20 20/73 51/73 51 
(7.8, 8.6] 8.2 a 9173 60/73 60 
(8.6, 9.4) 9.0 10 10/73 70/73 70 
(9.4, 10.2] 9.8 1 1/73 71/73 71 
(10.2, 11.0] 10.6 2 2/73 73173 73 


Total 73 73/73=1 
MMMMMMMMMMMmmc€55éé—>>>—-7z7—P7>> 7j7éÓEEEEE= PD mm A 
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3. Elección del límite inferior de la primera o superior de la última clase y cálculo de los límites de las demás 
clases. 


3. Cálculo de los valores medios de clase (v; ). Si l, es el límite inferior de la ¡-ésima clase y L, el límite superior, 
entonces: 


5. Cálculo de las frecuencias absolutas de clase (f,). f =número de observaciones que pertenecen a la 
¿-ésima clase. 


6. Cálculo de las frecuencias relativas de clase ( p,). 


Í 


número total de observaciones 


7. Cálculo de las frecuencias acumuladas relativas (F). 


F = E + p; (i=2,3,...,k), 


donde k es el número total de clases. 


8. Cálculo de las frecuencias acumuladas absolutas. El procedimiento es similar al descrito en el punto 7, pero 
usando frecuencias absolutas en vez de las relativas. 


2.3. Algunas observaciones sobre las tablas de frecuencias 


En el apartado 2.1 se anotaron algunas de las características que deben poseer los métodos que se emplean 
para organizar y presentar los datos. Las tablas de frecuencias satisfacen estos requisitos, pues además de poseer 
sencillez operativa (son muy fáciles de construir), constituyen una forma de presentar los datos de manera tal 
que la información que contienen es de fácil y rápida apreciación. Así, del ejemplo que hemos desarrollado se 
puede observar en forma inmediata: 


a) Los valores numéricos de los rendimientos que más frecuentemente se presentaron se encuentran entre 
7.0 y 7.8 kg; 20 del total de 73 observaciones pertenecen a ese intervalo. 


- 
b) Aproximadamente 95 % = x 100] de los rendimientos tienen un valor menor o igual a 9.4 kg. 
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Sin embargo, las tablas de frecuencias, al igual que todos los métodos que tienen como objetivo resumir los 
datos, poseen algunas desventajas que en ocasiones pueden ser graves, sobre todo cuando no se tiene a la 
disposición la masa completa de observaciones. Entre las desventajas más sobresalientes podemos anotar: 


1) Pérdida de información al presentar las observaciones en intervalos, sin especificar cuáles son los datos 
que pertenecen a ellos. Así, por ejemplo, no es posible saber directamente de la tabla cuáles son los 
valores numéricos de los datos que pertenecen al intervalo (8.6, 9.4]. 


2) El hecho de haber escogido como valor representativo de la clase al valor medio implica que se supone 
que los datos que pertenecen a la clase tienen en promedio un valor cercano a éste. Si esta suposición no 
es correcta, la información que nos proporciona v; es poco confiable. 


3) Dado que el número de clases y la anchura de las mismas se eligen en forma arbitraria, no existe una 
representación única de los datos en tablas de frecuencias. 


Para finalizar este apartado presentamos tablas de frecuencias con algunas de las variaciones anotadas con 
anterioridad, tales como: 


a) Tablas de frecuencias con los límites de clase elegidos de tal forma que ningún dato puede ser igual a ellos. 
b) Tablas de frecuencias con diferentes intervalos de clase. 
Estas dos variaciones se presentan en los ejemplos 2.3 y 2.4, respectivamente. 


Ejemplo 2.3. A continuación se presentan las edades de 83 investigadores en instituciones de investigación 
agropecuaria en México: 


Tabla 2.10. Edades de 83 investigadores en instituciones de investigación agropecuaria en México. 

29 44 27 27 26 25 27 35 27 34 28 28 32 
28 30 35 28 31 47 29 J3 37 39 31 30 28 
39 31 37 55 31 24 32 29 33 29 28 28 28 
27 26 29 26 33 57 28 26 24 31 28 31 27 
27 28 43 40 36 30 45 61 30 28 26 27 55 
30 30 30 28 59 32 31 46 26 27 39 34 33 
34 36 30 29 31 


FUENTE: Índice del personal científico y técnico en las instituciones de investigación agropecuaria en México 
Colegio de Postgraduados, Chapingo, México. 


Se presenta en seguida la tabla de frecuencias correspondiente a la Tabla 2.10, conteniendo únicamente los 
intervalos, valores medios y frecuencias relativas de clase: 
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Tabla 2.11. Tabla de frecuencias correspondientes a los datos de la Tabla 2.10. 


Intervalo Valor medio de clase (v,) Frecuencia relativa ( p,) 
(20.5,25.5] 23 3/83 
(25.5,30.5] 28 42/83 
(30.5,35.5] 33 21/83 
(35.5,40.5] 38 7/83 
(40.5,45.5) 43 3/83 
(45.5,50.5] 48 2/83 
(50.5,55.5) 53 2/83 
(55.5,60.5] 58 2/83 
(60.5,65.5] 63 1/83 

Total 1 + 


Ejemplo 2.4. La siguiente tabla de frecuencias corresponde a datos que agrupan el número de agricultores según 
rendimientos obtenidos por hectárea de maíz: 


Tabla 2.12. Tablas de frecuencia con diferentes intervalos de clase. 


Intervalo Valor medio de clase (v, ) Frecuencia relativa ( p,) 
0.51 o menos 1275/19792 
(0.51, 1.01] 0.76 3953/19792 
(1.01, 1.51] 1.26 4676/19792 
(1.51,.2.01] 1.76 4043/19792 
(2.01, 2.51] 2.26 2659/19972 
(2.51, 3.01] 2.76 1082/19792 
(3.01, 4.01] 3.51 1533/19792 
(4.01, 5.01] 4.51 352/19792 
Más de 5.01 219/19792 
Total 1 


__—_—_—___ 4 
FUENTE: Estructura del Sector Agrícola en Jalisco. Colegio de Postgraduados, Chapingo, 
México, 1969. 


Obsérvese que en este ejemplo varios de los intervalos de clase son distintos y además el primero y último intervalos 
so tiene uno de los límites de clase; consecuentemente, no es posible asignarles un valor medio de clase. 4 


2.4. Representación tabular de dos conjuntos de datos 


Frecuentemente surge la necesidad de presentar dos conjuntos de datos en una tabla que resuma la información 
contenida en ambos. Esta necesidad se satisface presentando las observaciones en Tablas de Frecuencias de Doble 
Entrada. Para que éstas no resulten complicadas en su lectura, sólo se utilizan tres de las columnas usadas en las 
tablas descritas con anterioridad, a saber: clases, valor medio y frecuencias relativas de clase. Si denotamos por X 
a la característica que corresponde a uno de los conjuntos y por Ya la del otro, y así mismo v, l; L; representan 
a los valores medios y límites de clase para X y v» l, L; los valores medios y límites de clase para Y, la tabla tendrá 


P 
la forma siguiente: 
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Tabla 2.13. Tabla de frecuencias de doble entrada. 


Mb] k] 


v, 


En la tabla puede observarse que las frecuencias relativas ( p) tienen dos subíndices, esto con objeto de indicar 
a qué clase pertenecen; así, por ejemplo, p;; indica que esta frecuencia relativa pertenece a la clase cuyos valores 


medios y límites de clase son respectivamente v;, li, L; para Y y v;, l, L; para X. 


Con objeto de ilustrar la construcción de este tipo de tablas presentamos el siguiente ejemplo. 


Ejemplo 2.5. En los datos de la Tabla 2.14 la variable X representa las alturas promedio en cm de plantas de 
trigo de la variedad Yécora F70 y Y el peso promedio en kg de la paja con grano. Para determinar un valor 
de X y Y se consideran 5 manojos obtenidos en 1 m? en cada una de 96 parcelas. Los datos se presentan en 


la Tabla 2.14. 


Para este ejemplo se han elegido 9 intervalos para la variable altura de las plantas (X) y 10 para el peso de la 
paja con grano (Y). La tabla resultante se presenta en la Tabla 2.15. En ella puede observarse que sólo existe 
una observación del total de 96 que tiene un valor para altura de planta en el intervalo (59.0, 60.8] y un 
peso de grano con paja en el intervalo (0.938, 1.000], a saber, la observación número 16, cuyos valores son 


X=60.0 y Y=0.953, por lo que el valor de la frecuencia relativa ps; es Z. Un razonamiento idéntico al 


anterior nos permitirá calcular los valores de las demás frecuencias relativas (P; ) r 


Si se desea saber la frecuencia relativa que corresponde a un cierto intervalo, por ejemplo el (59.0, 60.8], bastará 
, 2) ; ; 
con obtener el total de la columna respectiva, esto es F Si por otra parte se desea saber la frecuencia relativa 
9 


del intervalo (0.938, 1.000], basta obtener el total de la quinta hilera, esto es, 5 ; 


-n 
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Tabla 2.14. Promedios de alturas y pesos de paja con grano de plantas de trigo de la variedad Yécora 470, 


: Altura de planta Peso de paja con e Altura de planta Peso de paja con 
Observación 00 e ) Pb ed (ko) Observación 00 ( = ) AS $ P (ke) 
1 64.6 1.123 49 68.6 0.999 
2 65.2 1.138 50 69.6 1.145 
3 67.0 1.190 51 61.2 0.948 
4 62.2 1.156 52 66.4 0.933 
5 63.0 1.144 53 66.0 0.964 
6 64.6 1.305 54 64.4 0.949 
7 64.4 0.797 55 63.4 0.987 
8 65.0 1.121 56 64.8 0.858 
9 66.0 0.838 5 64.2 0.835 
10 63.4 1.015 58 66.6 1.124 
11 65.0 1.170 59 63.2 1.054 
12 63.6 1.150 60 69.0 1.070 
13 65.2 1.193 61 68.8 1.187 
14 66.2 1.090 62 68.8 KISZ 
15 63.0 1.067 63 63.0 1.068 
16 60.0 0.953 64 69.2 1.110 
17 62.6 0.749 65 67.8 RIZ 
18 64.8 0.946 66 69.0 0.936 
19 67.6 1.016 67 63.0 0.875 
20 63.8 0.874 68 66.0 0.760 
21 63.2 1.107 69 67.0 0.837 
22 63.0 0.976 70 64.0 0.848 
23 63.0 0.991 71 60.6 1.122 
24 62.8 1.067 72 62.2 0.695 
25 65.0 1.195 73 64.6 1.024 
26 62.8 1.214 74 63.2 0.886 
27 66.8 1.039 75 69.6 1.138 
28 65.0 1.050 76 67.0 0.984 
29 65.2 1.023 77 67.6 0.925 
30 65.2 0.904 78 67.8 0.965 
31 64.0 1.086 79 62.0 0.967 
32 63.2 1.029 80 61.8 0.984 
33 62.8 1.034 81 67.0 0.892 
34 63.4 0.907 82 73.2 1.200 
35 64.2 0.907 83 73.4 1.205 
36 65.0 1.162 84 73.8 1.003 
37 64.0 0.960 85 69.6 0.732 
38 61.8 1.074 86 71.6 1.265 
39 65.4 0.961 87 64.2 0.809 
40 63.0 1.057 88 69.4 0.910 
41 65.4 1.125 89 65.0 1.074 
42 63.0 1.064 90 65.4 0.948 
43 69.6 1:123 91 69.6 0.974 
24 65.0 0.938 92 67.0 1.110 
45 64.4 0.956 93 70.4 1.208 
46 63.0 1.050 94 68.0 0.887 
47 64.0 0.962 95 67.4 1.181 
48 65.2 0.958 96 63.6 0.916 


FUENTE: Cortesía del M. C. Emilio Jiménez García. 
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Lo anterior implica que de la tabla de doble entrada se pueden obtener tablas de frecuencias para cada una de 
las variables; así, por ejemplo, la tabla que corresponde a la variable X será: 


Tabla 2.16. Tabla de frecuencias mostrando las clases, valores medios y frecuencias 
relativas para la variable altura (X), obtenida de la tabla de doble entrada. 


Intervalo Valor medio v; Frecuencia relativa f; 
(59.0, 60.8] 59.9 2/96 
(60.8, 62.6] 61.7 7/96 
(62.6, 64.4] 63.5 32/96 
(64.4, 66.2] 65.3 24/96 
(66.2, 68.0] 67.1 14/96 
(68.0, 69.8] 68.9 12/96 
(69.8, 71.6] 70.7 2196 
(71.6, 73.4] 72.5 2/96 
(73.4, 75.2] 74.3 1/96 

Total 1 


La sabla de frecuencias para la variable Y se construye de manera similar a la de la variable X. ¢ 


2.5. Métodos gráficos para representar conjuntos de datos 


En d apartado anterior se resaltó la efectividad que poseen las tablas de frecuencias para destacar las características 
aierantes de un conjunto de datos. Sin embargo, resulta natural que una representación gráfica de los mismos 
a menudo ayude a que se distingan en forma inmediata algunas de las características más importantes de las 
abservaciones. En esta sección se consideran exclusivamente métodos que permiten representar gráficamente 
a los tipos de tablas estudiadas antes. Las gráficas que se describen son: Diagramas de Puntos, Histogramas, 
Polígonos de Frecuencias, Ojivas y Representación Gráfica de Tablas de Doble Entrada. 


Diagramas de puntos 


Sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad 


asociada a cada valor de la misma. 


A continuación presentamos dos tipos de diagramas de puntos. Los dos muestran esencialmente la misma 
información, sólo que en diferente forma y con diferente propósito. La construcción de estos diagramas se 


describe enseguida: 


a) El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los valores de la 
variable (los cuales en muchos casos son arbitrarios) y en el eje vertical las cantidades asociadas a éstos. 
Finalmente, para cada valor de la variable y cada cantidad asociada se dibujan puntos cuya altura 
corresponde a la magnitud de dicha cantidad. 


b) Para construir el segundo tipo de diagrama de puntos se colocan en el eje horizontal los valores de la 
variable y sobre cada valor se dibuja tantos puntos como veces aparecen éstos. 
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Estos dos tipos de diagramas de puntos se presentan en los ejemplos 2.6 y 2.7. 

Ejemplo 2.6. Para ilustrar la construcción del primer tipo de diagrama de puntos consideremos los datos 
presentados en la Tabla 2.1, la cual muestra el número de empleados del sexo masculino en algunas dependencias 
gubernamentales. 

Con objeto de simplificar la presentación, primero identificaremos a cada dependencia con un número; 
así, por ejemplo, la Secretaría de Educación Pública se identificará con el número 1, la de Marina con el 2, 
y así sucesivamente. Hecho lo anterior, tendremos que la variable en cuestión corresponde a las diferentes 


dependencias (X) y los valores numéricos que pueden tomar son 1, 2, 3, 4, 5 y 6. Las cantidades asociadas a estos 
números son los totales de hombres empleados. A continuación se presenta la gráfica resultante: 


140000 
120000 
100000 
80000 
60000 


40000 


Total de hombres empleados 


20000 


Figura 2.1. Diagrama de puntos que corresponde a los totales de hombres empleados (Y) por 
diversas dependencias (X) del sector público. € 


Ejemplo 2.7. La construcción del segundo tipo de diagrama de puntos se ilustra con los datos presentados en 
la Tabla 2.3, en la cual se muestran las frecuencias del número de estudiantes que obtuvieron una calificación 
dada en un examen final de la cátedra de Experimentación Agrícola en la Universidad Autónoma de Chapingo. 
A continuación se presenta la gráfica resultante: 


F 1 waaa a + 
o a (E: o: a a E TO 
30 40 50 60 70 80 90 


Figura 2.2. Diagrama de puntos que muestra muestra la distribución de las frecuencias 
del número de estudiantes que obtuvieron una calificación determinada en un examen de 
Experimentación Agrícola (ver Tabla 2.3). 4 
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Histogramas 
Llamaremos Histograma a la gráfica de barras verticales sin espaciamiento entre ellas, construída colocando en el eje 
vertical a las frecuencias absolutas o relativas y en el eje horizontal a los límites de clase de una tabla de frecuencias. 
Lo anterior implica que si los intervalos de clase son iguales, sobre cada clase se erigen rectángulos cuyas áreas 
son proporcionales a las frecuencias de clase. Las etapas que se deben cubrir en la construcción de un histograma 
son las siguientes: 

1. Colocar en el eje horizontal a los límites de clase. 


2. Colocar en el eje vertical las frecuencias relativas o absolutas. 


3. Erigir rectángulos cuya base son las clases y su altura las frecuencias que corresponden a cada clase. 
En la Figura 2.3 se muestra el histograma que corresponde a la Tabla 2.9. En él se utilizaron frecuencias relativas. 


En la Figura 2.3 es evidente el hecho de que, dados intervalos de clase iguales, las áreas de los rectángulos 
son proporcionales a las frecuencias relativas (p,). Se puede observar también que en este caso la figura 
presenta un cierto grado de simetría, lo que indica, para este ejemplo, que la mayoría de los datos pertenecen 
a las clases intermedias, esto es, a los intervalos (6.2, 7.0] y (7.0, 7.8] y el resto ocurren más o menos 
simétricamente alrededor de ellas. Claramente este hecho se capta en el histograma más fácilmente que en la 
tabla de frecuencias. 


Pi 
20/73 
15/73 
10/73 


5/73 


3.8 4.6 5.4 6.2 7.0 7.8 8.6 94 102 11 


Límites de clase 


Figura 2.3. Histograma correspondiente a la distribución de frecuencias que se presentó en 
la Tabla 2.9. 


En seguida presentamos otros histogramas que corresponden a las diferentes tablas de frecuencias de la sección 
anterior. 
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Ejemplo 2.8. Histograma correspondiente a una tabla de frecuencias donde los límites de clase tienen valores 
numéricos no presentes en los datos y que muestran una marcada asimetría hacia la derecha (Figura 2.4). 4 
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Figura 2.4. Histograma que muestra la distribución de frecuencias (ver Tabla 2.11) de las 
edades de 83 investigadores en instituciones de investigación agropecuaria en México. 


Ejemplo 2.9. El histograma de la Figura 2.5 corresponde a una tabla de frecuencias con diferentes intervalos o 
anchuras de clase. 4 


Pi 


5000/19 792 


4000/19 792 


3000/19 792 


1275 observaciones 
son menores o iguales 
que 0.51 


2000/19 792 219 observaciones 


exceden a 5.01 


1000/19 792 


0.51 1.51 2:51 3:01 4.01 5.01 


Límites de clase 


Figura 2.5. Histograma que muestra la distribución de frecuencias (ver Tabla 2.12) del 
número de agricultores según los rendimientos de maíz obtenidos por hectárea. 
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Debido a que en la tabla de frecuencias correspondiente al histograma de la Figura 2.5 los intervalos de clase no 
son iguales, los rectángulos que se erigen sobre las clases no tienen áreas proporcionales a las frecuencias. Esto 
ocasiona que algunas de las clases nos den una idea distorsionada del número de observaciones en ellas; así, por 
sjemplo, el histograma da la impresión de que una gran proporción de los datos pertenecen a las clases (3.01, 
4.01] y (4.01, 5.01]. Finalmente, debe observarse que aunque no es posible representar con barras a las clases 

imera y última, ya que carecen de uno de los límites, hemos indicado con una nota que existe un número 
específico de observaciones con valores mayores de 5.01 y menores o iguales que 0.51. 


Existen formas de corregir el defecto señalado en histogramas con diferentes anchuras de clase. Como no existe 
sazón de peso para construir histogramas con dicha característica, y dado que en este texto no trataremos sino el 
caso en que éstos tienen iguales anchuras de clase, no describiremos los procedimientos correctivos. 


Polígonos de Frecuencias (PF) 
Un PF es una gráfica de líneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los valores medios 
de clase y en el vertical a las frecuencias relativas o absolutas. Debe hacerse notar que el procedimiento equivale a 


unir los puntos medios de la cara superior de los rectángulos de un histograma por medio de líneas rectas. 


En la Figura 2.6 se muestra el polígono de frecuencias para los datos de la Tabla 2.9, y en la Figura 2.7 el mismo 
PF construido sobre el histograma. 


Pi 
20/73 A 


15/73 


10/73 7 ss 


e pl 


4.2 5.0 5.8 6.6 7.4 8.2 9.0 9.8 10.6 
Valor medio de clase 


Figura 2.6. Polígono de frecuencias correspondiente a la distribución de frecuencias presentada 
en la Tabla 2.9. 
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Pi 
20/73 


15/73 


10/73 


5/73 


E a a 22 QA A AAA AAA 
3.8 4.6 5.4 6.2 7.0 7.8 8.6 9.4 10.2 11.0 
Límites de clase 


Figura 2.7. Histograma y polígono de frecuencias correspondiente a la distribución de 
frecuencias presentada en la Tabla 2.9. 


Ojivas o Polígonos de Frecuencias Acumuladas (PFA) 


Una ojiva o PFA es una gráfica construida con segmentos de líneas rectas que unen los puntos obtenidos al colocar en 
el eje horizontal a los límites superiores de clase y en el vertical a las frecuencias acumuladas absolutas o relativas. En 
la Figura 2.8 se presenta la ojiva que corresponde a las frecuencias de la Tabla 2.9. 


Nótese que se ha considerado también al límite inferior de la primera clase y que se le ha asignado una frecuencia 
acumulada de cero. Asimismo, obsérvese que, por su naturaleza, una ojiva es no decreciente. 


2.6. Representación gráfica de dos grupos de datos 


En la sección 2.4 se describió la manera de presentar en forma tabular dos conjuntos de datos usando tablas 
de frecuencias de doble entrada. En este apartado ilustraremos la forma de construir gráficas a partir de dichas 
tablas. Nótese primero que si deseamos graficar una tabla de doble entrada necesitamos 3 ejes coordenados. Dos 
corresponden a las características o variables en cuestión, que hemos denotado por Xy Y, y otro a las frecuencias. 
Con lo anterior en mente, la representación gráfica de una tabla de frecuencias de doble entrada es una tarea 
relativamente sencilla. Los pasos a seguir son: 
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4.2 5.0 5.8 6.6 7.4 8.2 9.0 9.8 10.6 
Valor medio de clase 


Figura 2.8. Polígono de frecuencias acumuladas relativas para los rendimientos de plantas de 
maíz atacadas por el barrenador europeo (ver Tabla 2.9). 


1. Asignar dos de los ejes a las variables en cuestión. Sobre uno de ellos se colocan los valores medios de clase 
que corresponden a X y sobre el otro los que corresponden a Y. El eje restante se asigna a las frecuencias 


relativas ( Pij ) ; 


2. En el cruce de los valores medios de clase que identifican a cada celda se levanta una línea cuya altura es 
proporcional a la frecuencia relativa de dicha celda en la tabla de doble entrada. 


Con objeto de ilustrar lo descrito se muestra la gráfica que corresponde a la Tabla 2.15. 


0.08 7 

0.06 7 
< 0.04 

E 1,3 
IIA a 
HRT A oa 
0.02 Lonia tA e TG 
AIR 


le 0.7 


Figura 2.9. Representación gráfica de la tabla de frecuencias de doble entrada (Tabla 2.15). 
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Ejercicios 


2.1. Los siguientes datos se obtuvieron contando el número de vehículos que cruzan por un punto fijo de 
una avenida durante intervalos de un minuto. Los 54 conteos se hicieron a lo largo del mismo día. 
Construya una tabla de dos encabezados mostrando la frecuencia de cada medición obtenida. 


Número de vehículos por minuto 
28 30 25 36 24 27 33 26 29 
32 25 20 28 20 27 31 23 27 
24 34 25 24 22 26 28 38 32 
26 30 37 21 28 31 38 28 27 
23 32 39 26 29 33 28 20 22 
23 25 34 24 26 31 27 22 27 
De la tabla construida obtenga: 
a) Porcentaje de minutos con 30 o más vehículos. 


b) Porcentaje de minutos con menos de 25 vehículos. 


c) Porcentaje de minutos con más de 28 y 32 o menos vehículos. 


2.2. A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en jugo de toronja. 


Contenido de ácido ascórbico en 103 muestras de jugo de toronja (miligramos por mililitro) 


0.49 0.56 0.53 0.58 0.53 0.48 0.46 0.41 0.43 0.50 
0.49 0.47 0.46 0.43 0.38 0.39 0.51 0.51 0.50 0.45 
0.42 0.43 0.42 0.40 0.49 0.47 0.48 0.41 0.44 0.39 
0.35 0.33 0.35 0.40 0.43 0.47 0.47 0.46 0.48 0.50 
0.45 0.50 0.42 0.38 0.41 0.35 0.32 0.33 0.33 0.38 
0.40 0.45 0.50 0.41 0.45 0.48 0.43 0.48 0.47 0.37 
0.42 0.36 0.34 0.34 0.36 0.42 0.40 0.44 0.47 0.46 
0.50 0.44 0.43 0.41 0.40 0.38 0.41 0.36 0.36 0.34 
0.36 0.40 0.43 0.47 0.48 0.46 0.34 0.37 0.34 0.35 
0.37 0.39 0.38 0.41 0.46 0.43 0.42 0.44 0.38 0.36 
0.36 0.33 0.33 


FUENTE: Science, 4 de febrero de 1944, pág. 103. 


a) ¿Qué inconveniente tendría en este caso una tabla como la del problema 2.1? 


b) Elija límites de clases adecuados para estos datos y construya una tabla de frecuencias con límites 
y valor medio de clase, frecuencias absolutas y relativas, frecuencias absolutas acumuladas y 
frecuencias relativas acumuladas. 
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2.3. Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia virginica L.): 


24 28 28 28 27 28 29 29 29 30 
29 30 30 29 31 29 31 24 28 29 
28 24 28 29 31 31 24 28 29 30 
29 28 30 33 28 34 38 28 32 33 
28 31 32 34 39 40 31 35 27 28 
31 35 30 29 24 28 31 32 28 32 
28 29 30 33 41 30 29 42 28 29 
32 33 30 28 28 31 32 28 29 30 
28 28 31 34 34 28 36 31 36 35 


FUENTE: Science, 17 de noviembre de 1969. 


a) Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo. 
b) Construya una tabla de frecuencias que le permita contestar las siguientes preguntas: 
1. ¿Que porcentaje de células tiene 32 cromosomas o menos? 


2. ¿Qué porcentaje de células tiene más de 28 cromosomas? 


2.4. En seguida se presenta el número de errores cometidos y las carreras aceptadas por el equipo perdedor 
en cada uno de los juegos decisivos de las series mundiales de beisbol, de 1903 a 1969. 


Año 03 05 06 07 08 09 10 11 12 13 14 
Carreras 3 2 8 2 2 8 7 13 3 3 3 
Errores 3 0 0 2 0 3 A 3 2 P) 0 
Año 15 16 17 18 19 20 21 22 23 24 25 
Carreras 5 4 4 2 10 3 1 5 6 4 9 
Errores 1 3 3 2 1 2 1 0 1 3 2 
Año 26 27 28 29 30 31 32 33 34 35 36 
Carreras 3 A 7 3 Fd 4 13 4 11 4 13 
Errores 3 1 0 1 1 1 1 0 3 0 1 
Año 37 38 39 40 41 42 43 44 45 46 47 
Carreras 4 8 7 2 3 4 2 3 9 á 5 
Errores 0 1 4 0 1 1 1 2 0 0 0 
Año 48 49 50 51 52 53 54 55 56 57 58 
Carreras 4 10 5 4 4 4 7 2 9 s 
Errores 0 2 1 1 1 3 2 1 1 3 2 
Año 59 60 61 62 63 64 65 66 67 68 69 
Carreras 9 10 13 1 2 7 2 1 7 4 5 
Errores 1 1 3 l 1 2 1 0 1 0 2 


FUENTE: Turkin, H., y S. C. Thompson. The Official Encyclopedia of Baseball. South Brunswick and Barnes and Co., 1970. 
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Construya una tabla de frecuencias de doble entrada para carreras aceptadas y errores cometidos. 
Obtenga de ella las tablas de frecuencia individuales. Use para carreras los intervalos (0, 3], (3, 6], 
(6, 9], (9, 12], y (12, 15); y para errores use (0, 1], (1, 3], (3, 5]. 


2.5. La tabla de dos encabezados que sigue presenta la población estimada (en millones de habitantes) de 
20 países de América Latina para el año 2000'”. Dibuje el diagrama de puntos correspondiente. 


País Millones de habitantes 
Argentina 32.9 
Bolivia 10.3 
Colombia SS 
Costa Rica 37 
Chile 15.4 
Cuba 15:3 
R. Dominicana 11.8 
Ecuador 14.8 
El Salvador 8.8 
Guatemala 12.4 
Haití 7.0 
Honduras 6.9 
México 132.2 
Nicaragua 5.2 
Panamá 3.2 
Paraguay 5.3 
Perú 30.6 
Puerto Rico 37 
Uruguay 3.9 
Venezuela 23.6 
FUENTE: Naciones Unidas. Population Bulletin 
núm. 8, 1976. 


2.6. Dibuje un diagrama de puntos que represente la tabla obtenida en el ejercicio 2.1. 


2.7. La siguiente tabla de dos columnas presenta el número de premios Nobel por país (en las ciencias) entre 
1901 y 1939. Grafique los datos usando un intervalo idéntico para cada país en el eje de las abscisas y 
construya sobre los intervalos rectángulos de altura proporcional a las frecuencias. La gráfica resultante 
se llama Diagrama de Barras. También puede hacerse con frecuencias relativas o con porcentajes. 


A 
' Obviamente, al menos para México, el pronóstico era pésimo. (Nota añadida en la tercera edición). 
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País Número de premiados 
Suiza 5 
Dinamarca 4 
Holanda 9 

Suecia 6 
Alemania 37 

Gran Bretaña 21 

Austria 6 

Francia 15 

Canadá 2 

Bélgica 1 

Estados Unidos 15 

Italia 

España 1 
FUENTE: Science, Vol. 92. 4 de octubre de 
19407. 


2.8. Enseguida se separan los datos de la tabla anterior en dos partes: los premios obtenidos entre 1901 y 
1929 y los obtenidos entre 1930 y 1939. El orden de países es el mismo del ejercicio 2.7. 


1901 - 1929: 3, 4,7, 6, 27, 14, 3, 13, 2, 1, 5, 2, 1 (88 premios). 
1930 - 1939: 2, 0, 2, 0, 10, 7, 3, 2, 0, O, 10, 1, 0 (37 premios). 


Convierta estos números a porcentajes (con respecto al número total de premios otorgados en cada 
periodo) y haga lo mismo con los totales del ejercicio 2.7. En un solo sistema de ejes coordenados 
dibuje diagramas de barras para los dos periodos y para el total. Observe los cambios de periodo a 
periodo. 


2.9. Un tipo de gráfica que no se discutió en el texto es el llamado “de pastel”. En estas gráficas, un círculo 
es dividido en “tajadas”, cuya área es proporcional a la frecuencia relativa de una categoría dada. En 
seguida se presenta una clasificación (cualitativa) de viviendas en los medios rural y urbano en México 
y la gráfica de pastel correspondiente al medio urbano. 


Clasificación de viviendas 


Miti Buena Tolerable Mala Muy mala 
Urbano 11.40 14.21 0.35 74.04 
Rural 2.03 3.20 1.35 93.42 


FUENTE: Cortesía de Julio Boltvinick. 


“Sería interesante construir una tabla con los datos disponibles hasta 2009. 
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Muy mala 
(74.04) 
f 


/ 3 
Tolerable Mala 


(14.21) (0.35) 


Dibuje la gráfica de pastel para el medio rural y compárela con la del medio urbano. 


2.10. Dibuje el histograma, polígono de frecuencias y ojiva correspondientes a la tabla de frecuencias 
obtenida en el ejercicio 2.2 (use frecuencias relativas). 


2.11. Dibuje el histograma, polígono de frecuencias y ojiva correspondientes a la tabla de frecuencias 
obtenida en el ejercicio 2.3 (use frecuencias relativas). 


2.12. En la tabla siguiente se presenta la distribución del ingreso en México en 1975 (pesos por mes por 
familia). 


Ingreso Número de familias 
(0,500] 1 533 407 
(500,700] 578 756 
(700,950] 794 472 
(950,1250] 889 555 
(1250,1700] 918 944 
(1700,2200] 1 063 504 
(2200,3000] 1 249 808 
(3000,4000 865 596 
(4000,5200 695 025 
(5200,7000] 625 835 
(7000,8200 345 941 
(8200,12 550] 282 537 


Más de 12 550 348 977 
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a) Calcule las frecuencias relativas y dibuje el histograma de frecuencias relativas. Comente sobre 
la influencia de los intervalos en la apariencia del histograma. Dibuje el polígono de frecuencias 
relativas. 


b) ¿Qué porcentaje de familias tiene un ingreso de 2 200 pesos o menos? ¿mayor de 8 200? 


c) Dibuje la curva de frecuencias relativas acumuladas (sólo hasta la penúltima clase). Note que las 
preguntas del inciso anterior pueden responderse directamente de esta gráfica si se usa una escala 
adecuada y el dibujo es bueno. También, de manera aproximada, pueden estimarse gráficamente 
porcentajes que no aparecen en la tabla. Estime gráficamente el porcentaje de familias con 1 400 
pesos o menos de ingreso mensual. 


d) Con el mismo método gráfico encuentre, en la ojiva, el ingreso que corresponde a una frecuencia 
relativa acumulada de 0.5. 


2.13. Considere la siguiente tabla. 


Mortalidad general por grupos de edad en los 
Estados Unidos Mexicanos (1974). 


Años cumplidos Número de muertes 
Menores de un año 121 604 
l-4 37 983 
5-14 17733 
15 - 24 22 640 
25 - 44 51 279 
45 - 64 65 817 
65 y más 115210 


FUENTE: Estadísticas Vitales. E. U. M. 1974. 


Convierta la tabla a una con intervalos de la forma (a, b], (b, c], etc., completándola con frecuencias 
relativas y frecuencias relativas acumuladas. Dibuje el histograma de frecuencias relativas. Represente 
los datos en una gráfica de pastel y compare la información de ésta con la que proporciona el histograma. 


2.14. Represente gráficamente la tabla de frecuencias de doble entrada del ejercicio 2.4. Use frecuencias 
relativas. 


Cálculo y selección de medidas descriptivas 


3.1. Introducción 


En los ejemplos del capítulo precedente puede observarse que los histogramas o distribuciones de frecuencias 
presentan formas muy variadas, por lo que no es fácil comparar dos conjuntos de datos mediante la mera 
inspección de sus respectivos histogramas. Por otra parte, una tabla de frecuencias con 15 o 20 clases puede 
no ser una presentación suficientemente concisa de los datos. Por estas razones, y por el uso que de ellas se 
hará en los métodos inductivos que se estudiarán posteriormente, es necesario definir medidas que describan 
sucintamente al conjunto de datos que se estudia. Son de particular interés cantidades que localicen el “centro” 
de las observaciones (o más bien de su distribución de frecuencias) y la dispersión o variabilidad de las mismas. 
Las primeras son llamadas medidas de tendencia central y las segundas medidas de dispersión. Otro tipo de 
medidas surge cuando se consideran simultáneamente dos características y se quiere cuantificar el grado de 
asociación entre ellas. Este capítulo está dedicado a la discusión de estas medidas, que en conjunto reciben el 
nombre de medidas descriptivas. 


Para facilitar la presentación, es conveniente introducir previamente una nomenclatura para representar 
cualquier conjunto de datos, y un símbolo que denote la suma de elementos del conjunto, así como las reglas 
básicas para el manejo de este símbolo. 


3.2. Notación de suma y reglas para su uso 


Los conjuntos que son objeto de nuestro interés están integrados generalmente por (o pueden convertirse 
en) mediciones de alguna característica que se desea estudiar. Siguiendo las convenciones algebraicas usuales 
denotaremos a esta característica por una de las letras finales del alfabeto: X, Yo Z, por ejemplo. Así, si estamos 
midiendo la estatura y el peso en un grupo de individuos, podemos denominar X al peso y Ya la estatura. Para 
identificar cada una de las mediciones usaremos la letra minúscula correspondiente, con un índice que nos 
informe de qué individuo se trata. Supóngase que hemos medido el peso y la estatura de 10 individuos y hemos 
obtenido los siguientes resultados: 
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Tabla 3.1. Pesos y estaturas de 10 individuos. 
Individuo 1 2 3 4 5 6 7 8 9 10 
Peso (kg) 63 52 78 49 71 62 68 48 56 67 
Estatura (cm) 162 158 167 151 162 168 167 153 152 173 


El conjunto de mediciones integrado por los pesos uede representarse por Xy, Xy, X3, X4, Xe, X E E EA 

J grado p pesos p P POT Xp, X2, X3, Xy» X5, Xg X7, Xg» Xo Y Xio 
y el de las estaturas similarmente, usando Y en vez de X. De modo que tendremos x,=63, x,=52, y,=162, 
m= 15 1 , CTC; 


En ocasiones es necesario considerar los dos conjuntos de datos simultáneamente, y en ese caso los representaremos 
como puntos en el plano. Así, el peso y la estatura en el séptimo individuo tienen como representación el par 
ordenado (x,, y,)=(68, 167). 


Siguiendo esta convención, si denotamos a una característica por X, identificaremos a las observaciones por las 
letras x}, Xz, ..., x,5 donde 7 es el número de observaciones. En el caso de la Tabla 3.1, n=10. 


En la aplicación de las técnicas estadísticas es frecuente que se requiera representar la suma de varias observaciones; 
por ejemplo, la suma de los pesos en la Tabla 3.1. Puesto que sería muy tedioso escribir detalladamente la suma 
de ellas, es decir, 63+52+78+...+56+67, o su representación x, +x, +x; +... +x9+x1o se ha vuelto común el 
uso de la letra griega Y (sigma mayúscula) para indicar la operación de suma. 


Ejemplo 3.1. Considérense los pesos de la Tabla 3.1. x,=63, xX2=52, x3=78, x¿=49, x5=71, x¿=62, x,=68, 
x¿=48, x9=56, x,=67. 


10 
a) S y, =x; +x +x3 + x4 + x5 + x6 + + xg + x9 +X10 
i=j 


=63+52+78+49+71+62+68+48+56+67=614 


10 
b) D x; = xa +x9 + xio =48+56+67=171 
i=8 


6 
c) D x; =x; +x +x; +x =78+49+71+62= 260 
i=3 


Capítulo 3 
CÁLCULO Y SELECCIÓN DE MEDIDAS DESCRIPTIVAS 


4 
Y 2x, =2x +2x, +2x3 +2x4 
=l 


= 2(63) + 2(52) + 2(78) + 2(49) = 484 


S (x, —50) = (x —50) + (2, —50)-+(x, —50)+(x, —50) 


=13+2+28+(-1)= 42 


4 
l 


=63+52+78+49-50=192 


1 


3 

Da =x? +x +x =12757 

ži 

3 2 

È=) =(x, +x +x) =(63+52+78) =(193) =37249. e 


El ejemplo anterior ilustra algunas de las propiedades más importantes del símbolo de suma. Éstas y otras 
- propiedades se anotan a continuación para referencia posterior. 


Las demostraciones de estas cuatro propiedades son muy sencillas. En seguida se demuestra la primera de ellas. Se 
sugiere al lector que trate de demostrar las otras tres, o al menos que las verifique con los incisos del ejemplo 3.1. 


Ea 
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Antes de finalizar esta sección señalaremos algunos de los errores que más frecuentemente se cometen al 
interpretar expresiones donde aparece el símbolo de sumatoria. 


Dos expresiones que se confunden muy a menudo son: 


Yeg xi teeta? La suma de los cuadrados de las observaciones. 
i=] 
y 
= 
È s] =(x+x) + +x,) El cuadrado de la suma de las observaciones. 
i=l 


Es fácil ver que, en general, estas expresiones no son iguales, ya que la segunda tiene todos los términos de la 
primera más los productos x;xy, xx% etc. La diferencia entre ellas está ilustrada por los incisos g) y h) del ejemplo 
Hi, 


Otras dos expresiones que se prestan a equivocaciones son: 


Èx; La suma de los productos x por y. 
i=] 
y 
(558) 
A El producto de la suma de x por la suma de y. 


Ejemplo 3.2. Evaluaremos las dos expresiones anteriores para los datos de la Tabla 3.1. 


n 
a) Èx; =h +2) ++ o0 


i=] 
= (63)(162) + (52)(158) + --- + (67)(173) = 99568 
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b) [E ][E,)-6s xo +o+x0)0 +y ++ yo) 


i=] 
= (63 +52 +---+67)(162 +158 +---+173) 
= (614)(1613) = 990382 + 


3.3. Medidas de tendencia central (localización) 


Las medidas de tendencia central que estudiaremos son tres: Media aritmética, Mediana y Moda. En el apéndice 
3-A se discuten otras dos medidas de localización. 


Media aritmética 


La primera medida que se presentará es la llamada media aritmética (o simplemente media), que es la más 
común de las utilizadas para describir una distribución de frecuencias. 


Definición 3.1 (Media aritmética). La media aritmética de n observaciones de la variable X se denotará por el 
simbolo y, y se define como la suma de ellas dividida por ». Simbólicamente: 


Ejemplo 3.3. La media aritmética de los 5 números x,=2, x,=12, x3=9, x¿=10 y x5=7 es: 


o ALA 7 
x = — = 8 
5 
Si graficamos estos números y su media tenemos la siguiente figura: 
x=8 


Figura 3.1. Diagrama de un conjunto de datos mostrando a la media como el 
punto de equilibrio. 


Es claro, de la Figura 3.1, que la media aritmética corresponde geométricamente al punto de equilibrio de los 
daros. 0 


EX 
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Cálculo de la media aritmética en tablas de frecuencias 


En muchas ocasiones se nos presenta el problema de calcular la media a partir de una tabla de frecuencias. Esta 
situación puede ocurrir por dos razones: 


1. Ya se nos ha presentado los datos en forma resumida y no disponemos de las observaciones originales. 


2. Disponemos de las observaciones originales, pero su número es tan grande que las operaciones aritméticas 
necesarias para el cálculo de la media requieren mucho trabajo!'.. El uso de una tabla de frecuencias 
simplifica considerablemente el problema. 


Para describir el cálculo de la media en el caso que nos ocupa, consideremos una tabla de frecuencias cualquiera 
con k clases; valores medios de clase Vi» Vase» Vgs frecuencias absolutas Ji fa»... fs frecuencias relativas Pr Pa...» 
2 y donde, como se estudió en el capítulo 2, 


k 
Afan 


i=l] 


Una vez adoptada esta convención, el cálculo de la suma de las observaciones se simplifica. En la primera 
clase se tienen f; observaciones, cada una con valor (supuesto) vi, por lo que la contribución de esa clase a la 
suma total es fi v,. Similarmente, las contribuciones de las demás clases son fiva, f503, ..., fiv y la suma toral 
está dada por: 


e 


' Bueno, en 1980 no había computadoras personales. (Comentario añadido a la tercera edición). 
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la media aritmética tiene como expresión: 


k k 


Di 2 fiv, 


k 


zp 7 


i=] 


tivamente, puesto que la frecuencia relativa p; es igual a £/n, la media puede escribirse: 


k 
qe pa Pi; 
i=l 


3.4. En la Tabla 2.10 se presentaron los datos que sirvieron para la elaboración del histograma de 
Figura 2.4. Los datos son las edades del personal científico y técnico en las instituciones de investigación 
ia en México en el área de Ciencias Biológicas. Calcularemos la media aritmética para los datos 


y sin agrupar. 


obtener la media reproducimos la tabla de frecuencias 2.11, adicionando las columnas necesarias para su 
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Tabla 3.2. Tabla típica para el cálculo de la media en datos agrupados. 


Valor medio de Frecuencia relativa 


Intervalo clase (v,) Frecuencia (f.) (p,) fo, Pit; 
(20.5,25.5] 23 3 0.03614 69 0.83122 
(25.5,30.5] 28 42 0.50602 1176 14.16856 
(30.5,35.5] 39 21 0.25301 693 8.34933 
(35.5,40.5] 38 7 0.08434 266 3.20492 
(40.5,45.5] 43 3 0.03614 129 1.55402 
(45.5,50.5] 48 2 0.02410 96 1.15680 
(50.5,55.5] 53 2 0.02410 106 1.27730 
(55.5,60.5] 58 2 0.02410 116 1.39780 
(60.5,65.5] 63 1 0.01205 63 0.75915 


ho 83 1.00000 2714 32.6991 
——_—————<<2>=2%242— zo ma 32691 O 


Nótese que la suma de la sexta columna nos da directamente el valor de la media aritmética de acuerdo con la 
ecuación 3.6, pero se comenten errores de redondeo al calcular la frecuencia relativa. Por esta razón, la ecuación 
3.6 es poco usada en la práctica y, por lo general, sólo se incluyen las columnas 1, 2, 3 y 5 en una tabla para el 
cálculo de la media. Usando la ecuación 3.5 obtenemos: 


eE 4 
z=5— -= 212 32.6988 
83 
> 
j=l 
El valor real de la media, utilizando los datos individuales, es: 
X . S Q9+44+27+ +29 + 31) SN 32.6145 
y am m ae. = — ... z= — = 3 
Sa Y 83 


La diferencia entre este último valor y el obtenido a partir de la tabla de frecuencias se debe a la información que 
se pierde al agrupar los datos. ® 


Mediana 


El histograma de los datos del ejemplo 3.4, que fue presentado en el capítulo 2, es notable la asimetría de la 
distribución de frecuencias. Cuando se observa asimetría de la distribución (en el apéndice 3-A se propone una 
forma de medirla), la media no es una buena medida de tendencia central, ya que por ser el punto de equilibrio 
de los datos (ver ejemplo 3.3) resulta muy afectada por valores extremos. Para ilustrar este punto considérense 
los números 27, 3.4, 3.2, 3.3 y 3.1, donde el valor de la media (8.0) nos da una idea muy distorsionada de la 
magnitud de las observaciones. Para este tipo de situaciones es conveniente definir otra medida de tendencia 
central, la que recibe el nombre de mediana. 


Capítulo 3 
CÁLCULO Y SELECCIÓN DE MEDIDAS DESCRIPTIVAS 


Definición 3.2 (Mediana). La mediana (Me) de un conjunto de n números, ordenados de menor a mayor, es el 
múmero central en el arreglo. Si » es un número non, sólo hay un valor central en el arreglo. Si n es un número 
paz, hay dos valores centrales, y la mediana debe tomarse como la media aritmética de estos dos valores. 4 
Ejemplo 3.5. Calcularemos la mediana para los números 27, 3.4, 3.2, 3.3 y 3.1. 

El primer paso es ordenar los números con lo que obtenemos el arreglo: 


21,322.43, 34,27 


¡Como en este caso n=5 (número non), hay un solo valor central, que es 3.3, y éste es el valor de la mediana. 


Es decir, 
Me=3.3 
Nótese que la mediana es un valor más representativo del conjunto anterior que la media aritmética (Y =8). 4 
Ejemplo 3.6. Calcularemos la mediana para las estaturas de la Tabla 3.1. 
Los datos ordenados son: 
151, 152, 153, 158, 162, 162, 167, 167, 168, 173 


Puesto que 2=10 (número par), hay dos valores centrales, que son 162 y 162. La mediana es la media aritmética 
de estos dos valores. Es decir, 


162 +162 
Me = ——— =162 


4 
Ejemplo 3.7. Los pesos de la Tabla 3.1 son (ordenados): 
48, 49, 52, 56, 62, 63, 67, 68, 71, 78 


Los dos valores centrales son 62 y 63, la mediana es: 


62+6 
e= A =625 
2 
Para este conjunto de datos la media aritmética es: 
[A 614 
x=—)x =— = 61.4 
me" m 


y mo hay mucha diferencia entre la media y la mediana. Esto se debe a que el conjunto es relativamente simétrico. 


Pasa verificar esta aseveración pueden representarse los datos en un diagrama de puntos. 4 
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Cálculo de la mediana en tablas de frecuencias 


Por las mismas razones mencionadas al hablar de la media, agravadas para el caso de la mediana por la necesidad 
de ordenar los datos, en ocasiones requerimos calcular la mediana a partir de una tabla de frecuencias. 


Puesto que tratamos de encontrar un número tal que la mitad de las observaciones sean mayores o iguales 
que él, la mediana debe estar en una clase tal que la frecuencia relativa acumulada hasta la clase que la precede 
inmediatamente sea menor que 0.5 y la frecuencia relativa acumulada hasta la clase que buscamos sea mayor o 
igual a 0.5. A esta clase le llamaremos la clase de la mediana. 
Una vez localizada la clase de la mediana, el valor buscado se encuentra fácilmente si suponemos, como en el 
caso de la media, que las observaciones en esa clase se encuentran uniformemente distribuidas en el intervalo de 
clase. El valor de la mediana se localiza, por una simple interpolación, como sigue: 
Sean: 

a: límite inferior de la clase de la mediana. 

b: límite superior de la clase de la mediana. 


c: frecuencia relativa acumulada hasta la clase que precede a la clase de la mediana. 


d: frecuencia relativa de la clase de la mediana. 


Entonces podemos representar a la mediana por: 
Me=a+z2 


Donde z es una cantidad desconocida, pero que de acuerdo con nuestra suposición de uniformidad de las 
observaciones en el intervalo, debe cumplir la siguiente relación: si en una distancia b—4 encontramos una 
frecuencia relativa d, en z, que es la distancia del límite inferior de la clase de la mediana a la mediana, debemos 
tener una frecuencia relativa 0.5—c. Esto puede expresarse por una regla de tres simple: 


b=a_ 2 
d 0.5=c 


Despejando z obtenemos: 


(0.5—c)(b—a) 
d 


z= 
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De donde obtenemos, como la ecuación para la mediana: 


| Me = a4 #52050 


Ejemplo 3.8. Obtendremos la mediana para las edades de los 83 investigadores del ejemplo 3.4. 


Tabla 3.3. Tabla de frecuencias para el cálculo de la mediana. 


Intervalo Frecuencia Frecuencia relativa Frecuencia relativa acumulada 
(20.5,25.5] 3 0.03614 0.03614 
(25.5,30.5) 42 0.50602 0.54216 
(30.5,35.5) 21 0.25301 0.79517 
(35.5,40.5) 7 0.08434 0.87951 
(40.5,45.5] 3 0.03614 0.91565 
(45.5,50.5] 2 0.02410 0.93975 
(50.5,55.5] 2 0.02410 0.96385 
(55.5,60.5] 2 0.02410 0.98795 
(60.5,65.5] 1 0.01205 1.00000 


La clase de la mediana se identifica fácilmente como la segunda, o sea la que tiene como límites superior e 
inferior a 30.5 y 25.5, respectivamente. Tenemos entonces: 


a = 25.5 
b = 30.5 
c = 0.03614 
d = 0.50602 


1 
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De donde, usando la expresión (3.7): 


(30.5—25.5)(0.5—0.03614) 
Me = 25.5 + =———— = 30.0834 
e=243 0.50602 20003 


Si se ordenan los datos puede verificarse que la mediana calculada en las observaciones individuales es 30, por 
lo que el error que se ha cometido con la aproximación es insignificante. 6 


Moda 


Otra medida de tendencia central que se usa, aunque con menor frecuencia que las anteriores, es la Moda, cuyo 
nombre se explica perfectamente a partir de la definición. 


Definición 3.3 (Moda). La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre con mayor 
frecuencia. Si es un valor único decimos que la distribución de frecuencias es unimodal. Si se tienen dos o más 
valores con la misma frecuencia máxima decimos que la distribución es bimodal, trimodal, etc. 6 


Ejemplo 3.9. Las calificaciones obtenidas por un estudiante en 8 exámenes del curso de Genética Aplicada 
son: 


10,7,8,7,9,8, 7,9. 


La moda de este conjunto es 7, puesto que tiene una frecuencia de 3, mientras que los otros números: 10, 8 y 9 
tienen frecuencias absolutas de 1, 2 y 2 respectivamente. 4 


Se mencionó anteriormente que la moda puede no existir, o no ser un valor único. Estas dos situaciones se 
ilustran en los ejemplos 3.10 y 3.11. 


Ejemplo 3.10. Los pesos de la Tabla 3.1 son: 

63, 52, 78, 49, 71, 62, 68, 48, 56, 67 
En este caso todas las observaciones tienen la misma frecuencia, de manera que la moda no existe, a menos 
que cada uno de los valores se tome como moda, en cuyo caso esta medida pierde su utilidad como cantidad 
representativa del “centro” de los datos. 6 


Ejemplo 3.11. Las estaturas de la Tabla 3.1 son: 


162, 158, 167, 151, 162, 168, 167, 153, 152, 173 


qu 
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Todas las observaciones ocurren con frecuencia uno, con excepción de 162 y 167 que ocurren con frecuencia 
dos. El conjunto tiene dos modas: 162 y 167. 6 


Cuando la distribución de frecuencias es simétrica la media, mediana y moda coinciden. Esta propiedad puede 
werse gráficamente en el siguiente ejemplo. 


Ejemplo 3.12. Los números 6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1 y 10.8 son simétricos alrededor de 8.5. Para este 
conjunto: 


68 
7=5=85 
sem 
dea SSIES ai 
2 
Mo = 8.5 
6 7 8 9 10 11 


Media, Moda y Mediana 


Figura 3.2. Conjunto simétrico de datos, mostrando la coincidencia de media, 
moda y mediana. € 


Cálculo de la moda en tablas de frecuencias 


Por los problemas que se mencionan antes, la moda no es una medida muy útil cuando se consideran los 
dos individualmente. Sin embargo, cuando se calcula en una tabla de frecuencias, la moda adquiere mayor 
importancia, ya que es más frecuente que sea un valor único. Para propósitos descriptivos es suficiente reportar 
la dese modal, que es la clase cuya frecuencia absoluta es mayor. Como un valor único se toma el valor medio 


de la clase modal. 


Ejemplo 3.13. Consideremos de nuevo las edades de 83 investigadores presentadas en la Tabla 3.2. La clase 
amodal es la segunda, con límites inferior y superior 25.5 y 30.5, respectivamente. La moda es el valor medio de 
as dase. Es decir: 


2097305 eS 
2 


Mo 28 


3 se calcula la moda para estos datos sin agruparlos (Tabla 2.10), se encuentra este mismo valor. 4 


1% 
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De los ejemplos que se han manejado en esta sección, el conjunto de datos que se obtuvo tomando las edades de 
83 investigadores ha sido discutido en conexión con las tres medidas de tendencia central estudiadas. Usaremos 


estos mismos datos para ilustrar una propiedad de estas tres medidas. 


La media, mediana y moda para este conjunto son: 


Datos sin agrupar Tabla de frecuencias 
32.6145 32.6988 


Media 
Mediana 30.0000 30.0834 
Moda 28.0000 28.0000 
Podemos observar que: 
x > Me > Mo 


Esta relación se cumple para todos los conjuntos con asimetría hacia la derecha, es decir, en conjuntos donde el 
histograma tiene una cola extendida hacia la derecha. Si la asimetría es hacia la izquierda, la relación se invierte. 


En ese caso observaríamos: 
x < Me < Mo 
Para obtener un conjunto con asimetría hacia la izquierda podemos considerar, en vez de las edades, los años 


que le faltan a cada investigador para jubilarse. Es decir, si X representa la variable edad y 70 años es la edad de 


jubilación obligatoria, defínase: 


w; =70—x;; ¿=1,2,...,83 


La distribución de frecuencias de W será asimétrica hacia la izquierda, y en ella la media será menor que la 
mediana y ésta menor que la moda. 


Finalmente, si la distribución es simétrica tendremos: 


x = Me= Mo, 


situación que se presentó en el ejemplo 3.12. 
En el apéndice 3-A se discute una medida de asimetría. Allí se verá que para el primer caso el coeficiente de 


asimetría es positivo, para el segundo es negativo y en el tercer caso igual a cero. 


3.4. Medidas de dispersión 


En la sección anterior hemos discutido tres medidas descriptivas del “centro” de una distribución de frecuencias. 
Sin embargo, estas medidas no son suficientes para caracterizar la distribución, puesto que otro aspecto que debe 


-g 
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somarse en cuenta es la variabilidad de las observaciones. Como puede observarse en el siguiente ejemplo, es 
posible tener datos para los cuales las tres medidas coinciden, a pesar de ser conjuntos muy distintos. 


Ejemplo 3.14. En la Figura 3.3 se presentan los diagramas de puntos de dos conjuntos de datos. 


-4 2 0 2 4 6 8 10 12 14 16 18 20 


+ 20 2 4 6 8 10 12 14 16 18 20 


Figura 3.3. Dos conjuntos de datos con las mismas medidas de tendencia central, 


pero con diferente variabilidad. 


Es fácil comprobar que para ambos grupos la media, moda y mediana tienen el mismo valor, pero la variabilidad 
del primero es mayor que la del segundo. 6 


Con el propósito de medir la dispersión, se discutirán en este apartado cinco medidas: Amplitud, Desviación 
Media, Varianza, Desviación Estándar (también llamada Desviación Típica) y Coeficiente de Variación. 


Amplitud 


La medida de dispersión más simple recibe el nombre de amplitud, y es muy poco usada, puesto que su 
única ventaja es la sencillez con que se calcula. Es común que se use el nombre Rango para esta medida, 
por una traducción mecánica del inglés “range”. Puesto que rango se usa en este libro con su significado 
correcto —ver el capítulo 13— hemos elegido el término “amplitud” para la medida de dispersión que ahora 


definimos. 


Definición 3.4 (Amplitud). La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones de 
mayor y menor valor numérico en el mismo. 6 


Ejemplo 3.15. La amplitud de los datos en la parte superior de la Figura 3.3 es A=20—(—4)=24. Para los datos 
en la parte inferior de la figura A=13—3=10. 6 
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El resto de las medidas de dispersión que consideraremos involucran diferentes funciones de las desviaciones con 
respecto a la media. Estas desviaciones son: x| — X, x,— X,..., x,— X. Como una medida de la variabilidad total 
podríamos intentar tomar la suma de esas desviaciones. Sin embargo, esto no es útil, puesto que para cualquier 
conjunto esa suma es cero, según se muestra enseguida: 


n n n n 

PAE —3)= 23, -25=2x O 

i=] i=] ¡=1 ¡=1 
n 1 n n n 

= bae =n- x; = E? -Y x, =0 

i=l n ¡=1 


i=] i=l 


Esta propiedad se ilustra gráficamente con el siguiente ejemplo: 


Ejemplo 3.16. Los números 6, 2, 5, 4, 7, —1, 1 y O tienen como media aritmética 3, y sus desviaciones con 
respecto a la media son 3, —1, 2, 1, 4, —4, —2 y —3. Su gráfica se presenta enseguida: 


Figura 3.4. Las desviaciones negativas con respecto a la media cancelan a las 
positivas. ® 


Desviación media 


Para obtener una medida de dispersión basada en estas observaciones que no sea siempre cero, es necesario 
eliminar el signo de las mismas. Una forma de hacerlo es tomar el valor absoluto de cada desviación. Esto da 
origen a la medida de dispersión conocida como Desviación media. 


Definición 3.5 (Desviación Media). La desviación media (D.M.) de un grupo de observaciones se define como 
la suma de los valores absolutos de sus desviaciones con respecto a su media aritmética, dividida por el número 
de ellas. Es decir: 


D.M. =- Y lx, -x| 
"i= + 
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Ejemplo 3.17. Los valores absolutos de las desviaciones en el ejemplo 3.16 son: 


f [3|=3,]-1/=1,/2[=2,/1|=1,]4|= 4,]-4|= 4.|-2 E 2|-3|=3 
g 
- Portanto, 


D.M.==(B+I+...+3)=3(20)=25 


= 


Varianza y Desviación Estándar 


Una forma alternativa de eliminar el signo de las desviaciones con respecto a la media es elevarlas al cuadrado. 
De esta forma generamos la medida de dispersión que recibe el nombre de Varianza. 


Definición 3.6 (Varianza). La varianza (2) de un conjunto de datos es la suma de los cuadrados de las 
desviaciones de las observaciones con respecto a su media, dividida por el número de observaciones menos una. 


Su ecuación es: 


ps A Ya 7 


n—1 + 


Puesto que la varianza es una medida que tiene como unidades el cuadrado de las unidades originales de 
medición, se acostumbra definir también a su raíz cuadrada, para tener una medida de dispersión en las unidades 


originales. 


Definición 3.7 (Desviación Estándar). La desviación estándar (s) se define como la raíz cuadrada positiva de la 
warianza. Es decir, 
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Ejemplo 3.18. Calcularemos la varianza y la desviación estándar para los pesos de los 10 individuos en la Tabla 
aL 


Para el cálculo de la varianza es conveniente construir una tabla como la que se presenta enseguida: 


Tabla 3.4. Tabla para el cálculo de la varianza. 


Observación $e xXx (o-r y 
1 63 1.6 2.56 

2 22 =9.4 88.36 

3 78 16.6 275.56 

4 49 —12.4 153.76 

5 71 9.6 92.16 

6 62 0.6 0.36 

7 68 6.6 43.56 

8 48 13.4 179.56 

9 56 =5.4 29.16 

10 67 5.6 31.36 

BN 614 0 896.4 


X= ca =61.4 
1 
Para la varianza tenemos: 
ts E =99.6 


y su desviación estándar es: 


s = 499.6 =9.98 


Nótese que la varianza de los pesos es 99.6 kilogramos cuadrados, mientras que la desviación estándar es 9.98 
kilogramos. Podemos describir los datos diciendo que tienen una media de 61.4 kilogramos y una desviación 
estándar de 9.98 kilogramos. + 
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i 


a cálculo de la varianza a partir de la ecuación en la definición 3.6 requiere obtener cada una de de las 
"desviaciones con respecto a la media. Este puede ser un proceso tedioso y tardado si el número de observaciones 


es grande. Enseguida se deriva una expresión alternativa para el cálculo de la varianza. 
| 


| 
- El numerador de s” puede transformarse en: 


n n 


Ns -x = N (x? a )= Sy e 
i=] 


i=] i=] i=l i=l 


e ua +n? e — 2%? + nx? 


i=l] i=] i=l 


2 


Entonces, la suma de cuadrados de las desviaciones puede escribirse: 


e 2 
n n 2% 
De-a) =D -— 
i=l 


i=l n 


(3.9) 
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Ejemplo 3.19. Calcularemos la varianza de los pesos de la Tabla 3.1 usando la ecuación (3.10). 


3969 


2704 6084 2401 5041 3844 4624 2304 3136 4489 


614? | 1 
pal 38596 149" = ¿[98596 229] 
9 10 9 


1 
= g 826.4) = 99.6 


Cálculo de la varianza en tablas de frecuencias 


Para calcular la varianza en una tabla de frecuencias operamos bajo las mismas suposiciones que, en el caso 
de la media, nos llevaron a considerar como valor representativo de todas las observaciones en una clase a 
su valor medio. Así, tendremos que la desviación de una observación en la clase 1 está dada por 4 —X, y su 
cuadrado por (v, —x)”. La contribución de la primera clase a la suma de cuadrados será entonces (a -FY f. 
Similarmente, tendremos (v, — x) fa (vu, — xy Fr. O x) fa como contribuciones de las clases 2, A 
k. La ecuación para la varianza resulta ser: 


i=] (3.11) 


Como en el caso de los datos sin agrupar, podemos obtener una ecuación que simplifique el cálculo de la 
varianza en tablas de frecuencias. Dichas ecuaciones se obtienen enseguida: 


k k 
Nox) f= Dle -27n f, +x? f,) 


i=] 


Podemos escribir entonces, como expresión para el cálculo de la varianza en tablas de frecuencias, 


$ 2 
1 k (Sas) 


$ v f, PER BO Y 
p= n (3.12) 


$= 
n—] 


- 
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Esta última ecuación es, por regla general, la más conveniente para el cálculo de la varianza en una tabla de 


| cuencias. 


| 
| ida presentamos un ejemplo del cálculo de la varianza en una tabla de frecuencias, el cual nos servirá, de 
p jemp. 
} . + 
paso, para presentar la forma de la tabla que consideramos más adecuada para este fin. 


Ejemplo 3.20. Los datos que han servido para la elaboración de la Tabla 3.5 son mediciones mensuales de 
æ cencia de conducción de agua (en %) de riego en el distrito número 38 (Río Mayo, México), de octubre de 
1566 a septiembre de 1974. 


Tabla 3.5. Cálculo de la varianza en una tabla de frecuencias. 


Valor medio de 2 2 

Intervalo Frecuencia (f,) clase (v;) fiv: Y Lv; 
(32,38] Z 35 70 1225 2450 
(38,44] 7 41 287 1681 11767 
(44,50] 3 47 141 2209 6627 
(50,56] 8 53 424 2809 22472 
(56,62] 20 59 1180 3481 69620 
(62,68] 42 65 2730 4225 177450 
(68,74] 11 z1 781 5041 55451 
(74,80] 2 77 154 5929 11858 
(80,86] 1 83 83 6889 6889 
S 96 5850 364584 


FUENTE: Palacios Vélez, Enrique. Introducción a la teoría de operación de distritos y sistemas de riego, 1977. 
Colegio de Postgraduados, Chapingo, México. 


¡Con los totales de la tabla obtenemos: 


i=l 


d 


1 
= — | 364584 — 
Al s 96 


1 
= 95 (8099-6250) = 85.2592 
s =9.2336 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


La eficiencia de conducción de agua en el distrito de en los 96 meses considerados tiene una media de 
60.9375 %, con una desviación estándar de 9.2336 %. 


En los datos sin agrupar la media tiene un valor de 61.1854 %, y la desviación estándar es 9.2366 %. 
Coeficiente de variación 


Las medidas de dispersión anteriores son todas medidas de variación absoluta. Una medida de dispersión relativa 
de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de variación. 


Definición 3.8 (Coeficiente de Variación). El coeficiente de variación (CV) es una medida de dispersión 
relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su 


media aritmética. 


Simbólicamente, para la característica X, tenemos: 


Cv(x)= 


xX 


Ejemplo 3.21. Los pesos (X) y estaturas (Y) de la Tabla 3.1, tienen las siguientes medias y desviaciones estándar: 


=61.4 sx = 9.98 
7=161.3 sy= 7.60 


Los coeficientes de variación son: 


9.98 
CV(X) == =0.162 
4%) 61,4 à 


7.60 
CV(Y)=—— =0.0471 
4) 161.3 
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13. expresado en porcentajes, que es la forma más usual: 


CV(X) = 16.25 % 


CV(Y) = 4.71 % 


¡Comparando los coeficientes de variación, es lícito decir que los pesos tienen mayor variabilidad que las estaturas 
los diez individuos considerados. 4 


3.5. Selección de medidas descriptivas 


En las secciones 3.3 y 3.4 se han señalado las características más sobresalientes de las medidas de tendencia 
«entral y de dispersión. En este apartado analizaremos sus méritos relativos y resumiremos las discusiones 


aisladas de las secciones precedentes. 


Las tres medidas de tendencia central que se han definido tienen ventajas y desventajas. La media aritmética 
És. sin lugar a dudas, la más usada de las tres. La razón principal de su popularidad es que posee propiedades 
asóricas que la vuelven indispensable en los métodos de la estadística inductiva. Sin embargo, cuando sólo 
s trata de describir los datos; la moda, y especialmente la mediana, pueden ser mejores. En particular, 
sumando la distribución de frecuencias es marcadamente asimétrica, la mediana nos da una idea más exacta 
del “centro” de la distribución que la media. Otras medidas (intermedias entre la media y la mediana, 
por lo que respecta a su sensibilidad a la asimetría), se presentarán en el apéndice 3-A. Debe también 
Fenerse en cuenta que cuando se tienen tablas de frecuencias con el primer intervalo de clase abierto, no es 
posible calcular la media, por lo que necesariamente debemos usar la moda o la mediana como medidas de 


sendencia central. 


Por lo que toca a las medidas de dispersión hay poco que agregar. La desviación media es muy poco usada 
debido a lo tedioso de su cálculo, y a que su manipulación algebraica es difícil. La amplitud tiene como ventaja 
que es muy fácil de calcular, pero es muy sensible a valores extremos y puede crecer desproporcionadamente 
con el número de observaciones. La medida de dispersión mas usada es la desviación estándar, que comparte 


E: 
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las ventajas y desventajas de la media aritmética. El coeficiente de variación debe usarse para comparar la 
variabilidad de dos conjuntos de datos. 


3.6. Descripción simultánea de dos conjuntos de datos 


Cuando se estudian dos características, una pregunta que surge con frecuencia es si existe alguna relación entre 
ellas. Como ejemplos podemos mencionar el peso y la estatura de un grupo de individuos, la temperatura y la 
tasa de reproducción de una bacteria, el ingreso y el consumo por familia, etc. 


En el capítulo 2 se presentaron métodos tabulares y gráficos para estudiar dos conjuntos de datos. En esta 
sección se estudiarán dos medidas que son útiles para describir el grado de asociación entre ellos: la Covarianza 
y la Correlación. 


Covarianza 


Definiremos primero la medida de asociación que recibe el nombre de covarianza. 


Definición 3.9 (Covarianza). Sean (xoy); ¿A TO E A n pares de observaciones de dos 
características X y Y, y sean Y y y sus respectivas medias. La covarianza entre las dos características se 
define como: 


Como en el caso de la ecuación para la varianza, podemos obtener una forma alternativa que no involucra el 
cálculo de las desviaciones con respecto a las medias. El numerador en la ecuación para la covarianza puede 
expresarse como: 
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n n 
Dls 0-3) =D (xy +) 
i=l i=l 


=Y 3) 3-3) 1 + 037 


i=] i=] ¿=1 i=] 


Neg A T, 


i=l i=l 


también en la forma: 


i=l 


TE EA 


i=l i=l 


esta última expresión obtenemos una ecuación para el cálculo de la covarianza, que es ideal para usarse 


una calculadora de bolsillo. 


3.22. Presentamos el cálculo de la covarianza para los pesos y estaturas de la Tabla 3.1 usando las 


nes presentadas antes. 


, usar la ecuación dada en la definición 3.9; requerimos la siguiente tabla. 


Tabla 3.6. Cálculo de la covarianza usando desviaciones. 


Xx; Ji x, =X JF (x; = xy, -J) 
0 63 162 1.6 0.7 1.12 
52 158 -9.4 3.3 31.02 
78 167 16.6 5.7 94.62 
49 151 di 10.3 127.72 
71 162 9.6 0.7 6.72 
62 168 0.6 6.7 4.02 
68 167 6.6 5.7 37.62 
d 48 153 —13.4 -8.3 111.22 
f 56 152 -5.4 -9.3 50.22 
67 173 5.6 11.7 65.52 


A 614 1613 0 0 529.80 
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1 


a=]; 


2 l 
sy = (0, = 7) = 629.80) = 58.86 
=1 


Tabla 3.7. Cálculo de la covarianza con la ecuación simplificada. 


X; Ji Y; 
63 162 10206 


52 158 8216 
78 167 13026 
49 151 7399 
71 162 11502 
62 168 10416 
68 167 11356 
48 153 7344 
56 152 8512 


67 173 11591 


E 614 1613 99568 
i U o e O 


DAD 


12 A | sads») 
= y 2 |=-| 9956823929) 
Sxy 7 fer Xi Ji pa 9 10 


(positivas) de Y. 
De lo anterior se sigue que, cuando los valores de X aumentan con los valores de Y, la covarianza es positiva, 
y cuando los valores de X disminuyen al aumentar los valores de Y, la covarianza es negativa. De aquí que 


hablemos de la covarianza como de una medida de la asociación entre dos variables. 


En el ejemplo 3.23 tenemos un caso de covarianza negativa. 
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3.23. 


Tabla 3.8. Pérdidas esperadas en rendimiento de soya por riego inoportuno. 


Porción de humedad Pérdida en 
consumida (X) pesos (Y) xdi 
0.00 4593.00 0.00 
0.10 3141.60 314.16 
0.20 1965.20 393.04 
0.30 1064.20 319.26 
0.40 438.60 175.44 
0.50 85.00 42.50 
0.58 0.00 0.00 


pY 2.08 11287.60 1244.40 


FUENTE: Palacios Vélez, Enrique. Introducción a la teoría de la operación 
de distritos y sistemas de riego, 1977. Colegio de Postgraduados. Chapingo, 
Méx. 


1 


351.6049 
+ 


EE 


Correlación 


Una desventaja de la covarianza como medida de asociación es que su valor depende de las unidades en que se miden 
las variables. En el ejemplo 3.23 se ha medido la porción de humedad consumida, como fracción de la unidad. 
Teualmente podría haberse reportado el porcentaje de hum edad consumida, es decir 0 %, 10 %, 20 %, etc. En este 
aso se hubiese obtenido un valor muy distinto para la covarianza. Para evitar esta propiedad indeseable, se ha ideado 
na medida de asociación que es independiente de las unidades de medición, la cual recibe el nombre de Correlación. 


Definición 3.10 (Correlación). Sean (xy); (x2 12 J>- (Xn Yn ), n observaciones hechas en dos características. 
Sean syy» Syy Sy la covarianza entre ellas y las desviaciones estándar correspondientes. El coeficiente de correlación 
Íryy ) , o simplemente la correlación entre las dos variables, tiene como expresión: 
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= AF 
Yxy — 


Sx Sy + 


De manera más explícita, la ecuación puede escribirse: 


ga EÈ) 


¡=1 j=] 
Ejemplo 3.24. Para los pesos (X) y estaturas (Y) de la Tabla 3.1 tenemos (ver ejemplos 3.21 y 3.22): 


sx = 9.98 sy= 7.60 Syy 7 58.86 


Por lo que: 


58.56 


mata saa 
2Y =(9.98)0.60) 


Un caso de correlación negativa se tiene con los datos del ejemplo 3.23, donde se calculó la covarianza para 
humedad consumida (X) y pérdida en pesos (Y), y se obtuvo: 


Es fácil verificar que: 


$x=0.2115 y  sy= 1730.0294 


Se tiene entonces: 


—351.6049 


= == =0.9609 
(0.2115)(1730.0294) 


ryy 


Es claro que esta medida no tiene dimensiones. Considérese el caso de los pesos y estaturas. La covarianza está 
dada en centímetros por kilogramo; sy en kilogramos, y sy en centímetros. Por tanto, el cociente xy no tiene 
unidades. 
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finalizar este ejemplo, representaremos gráficamente la correlación en lo dos casos discutidos previamente. 


gráfica de dispersión para los pesos y estaturas se presenta enseguida: 


180 


170 


160 


150 


140 
peu E X 


40 50 60 70 80 
Figura 3.5. Gráfica de los pesos y estaturas de 10 individuos, mostrando correlación 


positiva. 


La Figura 3.5 es claro que valores grandes de X corresponden a valores grandes de Y; de ahí el valor positivo 
e La correlación (0.7760). 


e esta situación con la de la Figura 3.6, donde se grafican las pérdidas en peso (Y) y la porción de 
n consumida (X) del ejemplo 3.23. En este caso la correlación negativa (—0.9609) es consecuencia de 
las pérdidas mayores se tienen para valores bajos de humedad consumida. ® 
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5000 


4000 


1000 


Figura 3.6. Gráfica de la proporción de humedad consumida (X) y pérdida esperada en pesos 
(Y) por riego inoportuno, mostrando correlación negativa. 


dice A: El coeficiente de asimetría y dos medidas 
ativas de tendencia central 


æ la sección 3.3 se comentó brevemente sobre la asimetría de una distribución de frecuencias, y en la sección 
al discutir los méritos relativos de las medidas de tendencia central, se afirmó que para distribuciones 
ascadamente asimétricas la mediana puede ser mejor medida de tendencia central que la media. En este 
dice se propondrá una medida de la asimetría y se presentarán dos medidas de tendencia central que pueden 
en vez de la media o la mediana en el caso de una distribución asimétrica de las frecuencias. 


jente de asimetría 


edida más usada para cuantificar la asimetría de la distribución de frecuencias de una característica X, recibe 
abre de coeficiente de asimetría y tiene por ecuación: 


NE =x) 
"ia 
r 
X (3.A.1) 


sy es la desviación estándar de X. 


alo 3.A.1. En el ejemplo 3.12 se calcularon la media, moda y mediana de un conjunto de datos y se afirmó 
su distribución de frecuencias es simétrica, por lo que esas tres medidas coinciden. Calcularemos la asimetría 
æsa ese conjunto. 


Tabla 3.A.1. Cálculo del coeficiente de asimetría. 


F X; AR (x, -x) (x, -xy 

6.2 -2.3 5.29 —12.167 

7.9 -0.6 0.36 —0.216 

8.1 —0.4 0.16 —0.064 

8.5 0.0 0.00 0.000 

8.5 0.0 0.00 0.000 

8.9 0.4 0.16 0.064 

i 9.1 0.6 0.36 0.216 

| 10.8 2.3 5.29 12.167 
| 5 68 0 11.62 0 

7=85 
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Tenemos, entonces, 


a 


f =5(01.62)=1.66 
sí =2.1388 

=O) 
LE 


El coeficiente de asimetría puede calcularse en una tabla de frecuencias si hacemos la misma suposición que 
en el caso del cálculo de la media y la varianza; es decir, si suponemos que todas las observaciones en una clase 
pueden representarse por el valor o punto medio de esa clase. La ecuación 3.A.1 se modifica como sigue para 
usarse en una tabla de frecuencias: 


1 n 
a p> (v; —x y Íi 
™ = i=] 3 
sx (3.A.2) 


Donde » es el número de observaciones, % el número de clases y v; y f; son el valor medio y la frecuencia de la 
clase ¿-ésima. 


Ejemplo 3.A.2. Calcularemos el coeficiente de asimetría para las edades de 83 investigadores que se analizaron 
ampliamente en el capítulo 3, y cuya tabla de frecuencias se presentó en el ejemplo 3.4. 


Tabla 3.A.2. Cálculo del coeficiente de asimetría en una tabla de frecuencias. 


Intervalo v; FE uf (o, -xY f (Y £ 
(20.5, 25.5] 23 3 69 282.200 —2737.003 


(25.5, 30.5] 28 42 1176 927.306 —4357.227 
(30 5, 35.5] 29 21 693 1.905 0.574 
(35.5, 40.5] 38 7 266 196.719 1042.847 
(40.5, 45.5] 43 3 129 318.344 3279.327 
(45.5, 50.5] 48 2 96 468.253 7164.840 
(50.5, 55.5] 53 2 106 824.277 16733.821 
(55 5, 60.5] 58 2 116 1280.301 32393.163 
1 


(60.5, 65.5] 63 63 918.163 27821.432 


D 83 2714 5217.468 81341.774 


Con los resultados de la tabla: 


x = 32.6988 


2-1 
q gz 5217.468) = 63.628 
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sx =507.542 


1 k = 1 
ox f —(81341.774) 
dy = 88 
$ 507.542 


en esta distribución de frecuencias, con una larga cola hacia la derecha, el coeficiente de asimetría 


+ 
3.3 se mencionó que podría obtenerse una distribución de frecuencias con asimetría hacia la izquierda 


w; =70-x, ¡=1,2,...,83; 


-son las edades de los 83 investigadores para los cuales se calculó la asimetría en el ejemplo 3.A.2. En el 
siguiente se discutirá la asimetría para las observaciones de la variable W, definida arriba. 


3.A.3. Los años que le faltan a cada uno de los investigadores para cumplir 70 se obtienen restando de 


las edades del ejemplo 3.4. Los valores resultantes (w; ) son: 


41 39 40 42 44 38 37 39 40 
26 46 42 42 41 39 33 43 41 
43 38 44 38 44 24 37 43 39 
43 41 43 42 37 44 39 42 
4 37 15 40 13 43 4 27 
45 41 40 35 42 31 42 30 
43 42 40 42 44 36 31 34 
35 42 40 39 46 37 39 40 
43 42 42 23 39 36 33 25 
36 43 11 41 42 34 ž 15 9 


Intervalo V; Í fri Pi Fi 

(4.5, 9.5] 7 1 7 0.01205 0.01205 

(9.5,14.5] 12 2 24 0.02410 0.03615 
(14.5, 19.5] 17 2 34 0.02410 0.06025 
(19.5, 24.5] 22 2 44 0.02410 0.08435 
(24.5, 29.5] 27 3 81 0.03614 0.12049 
(29.5, 34.5] 32 7 224 0.08434 0.20483 
(34.5, 39.5] 37 21 777 0.25301 0.45784 
(39.5, 44.5] 42 42 1764 0.50602 0.96386 
(44.5, 49.5] 47 3 141 0.03614 1.00000 


y 83 3096 1.00000 
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De la tabla obtenemos: 


3096 


== 
83 


= 37.3012 


Además, es fácil verificar que la mediana y la moda son: 


Me = 39.9166 
Mo = 42 


Por lo que se tiene, como se mencionó en el apartado 3.3, para distribuciones con asimetría hacia la izquierda: 


Media < Mediana < Moda 


Por otra parte, si se construye el histograma para la tabla de frecuencias, 
espejo del obtenido para las edades, por lo que se tiene la misma cola haci 
derecha. Se deja como un ejercicio para el lector 
es el mismo que el obtenido para las edades, 


es fácil ver que éste es la imagen en el 
a la izquierda que antes se tenía hacia la 
comprobar que el coeficiente de asimetría para esta distribución 
sólo que esta vez con signo negativo. Es decir: 


Ayy = —1.931 4 


Medidas de tendencia central útiles en distribuciones asimétricas 
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| Enseguida se ilustra el cálculo de estas dos medidas con los mismos datos del ejemplo 3.A.2. 


Ejemplo 3.A.4. Las edades (ordenadas) del ejemplo 3.4 son: 
| 


I 


24 27 28 28 30 31 33 39 57 
24 27 28 29 30 31 34 39 59 
25 27 28 29 30 31 34 40 61 
26 27 28 29 30 32 34 43 
26 27 28 29 30 32 35 44 
26 27 28 29 31 32 35 45 
26 27 28 29 31 33 36 46 
26 27 28 30 31 33 36 47 
26 28 28 30 31 33 37 55 
27 28 28 30 31 33 37 55 


Puesto que tenemos 83 observaciones, el 25 % de este número es 20.75, de modo que eliminamos, para el 
cálculo de la media podada, las primeras y las últimas 21 observaciones, por lo que calculamos la media de las 
41 observaciones restantes. La media podada es: 


10X28+6X29+8X30+8X31+3X32+5X33+1x34 _ 1237 _ 30.1707 
41 A 


Para el cálculo de la media de Windsor las primeras 21 observaciones las hacemos iguales a 28 y las últimas 21 
iguales a 34, por lo que la media de Windsor es: 


A IOKIN HOKI E A a A NT 
83 ES 


En este caso las dos medias (podada y de Windsor) tienen valores muy similares: 30.1707 y 30.5904. La media 
aritmética de estos 83 datos es 32.6145 y la mediana es 30.0. Nótese que para este ejemplo las dos medidas 
propuestas se acercaron más a la mediana que a la media, pero no difieren apreciablemente de la primera. En 
otros casos, estas medidas tendrán valores intermedios entre la media y la mediana. 4 


La media podada y la media de Windsor pueden considerarse como compromisos entre la media y la mediana. 

La primera de ellas “poda” las observaciones que caen fuera del 50 % central de los datos. La segunda mueve estas 

observaciones al 50 % central antes de tomar su promedio. Se ha encontrado que en el caso de distribuciones 
q 
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simétricas éstas dos medidas son casi tan buenas como la media aritmética, pero se comportan mejor en el caso 
de distribuciones asimétricas o cuando hay unas pocas observaciones extremas. 


La elección del 50 % de las observaciones centrales para el cálculo de estas dos medidas se hizo arbitrariamente, 
por ser éste un valor muy usado. Puede elegirse cualquier otro valor como el porcentaje de observaciones que 
deben eliminarse o reemplazarse. Si denotamos por & este porcentaje, podemos definir medias podadas y medias 
de Windsor para cualquier æ entre cero y cien. Representaremos por X, a la media podada y por X,,,, a la 
media de Windsor. Para calcular X,, o X,,, basta reemplazar por 1/2 el valor particular (25 %) usado en la 
descripción de su cálculo presentada antes. Nótese que las medias calculadas en el ejemplo 3.A.4 son XY 
X„so. En la referencia 3.A.1 pueden encontrarse lineamientos para elegir æ con base en el valor de algunas 
medidas descriptivas. 
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Apéndice B. 
Codificación de los datos 


Algunas veces las magnitudes de los datos ocasionan que el cálculo de las medidas descriptivas sea complicado”. 
Tal es el caso de mediciones de constantes físicas donde no es extraño encontrar cantidades con un buen número 
de ceros después del punto decimal (1.38x10”*, por ejemplo) o por el contrario, números muy grandes. En 
estas situaciones es conveniente codificar los datos. Por codificación de los datos entenderemos la multiplicación 
de todas las observaciones por una constante y la adición posterior de otra (o la misma) constante a las cantidades 
resultantes. Simbólicamente, si x}, x4»... X„ son 2 observaciones de una característica X, y tanto a como b(6%0) 
son dos constantes cualesquiera, la codificación las transforma en: 


z; =a+bxys ¡=1,2,...,n. 


Llamaremos X a la variable original y Za la transformada. 


El objetivo principal de este proceso es calcular las medidas descriptivas en números más fáciles de manejar 
que los obtenidos originalmente. Se sigue entonces que para que la codificación sea realmente de utilidad es 
necesario tener ecuaciones que nos permitan calcular estas cantidades en la variable original, una vez que se 
tengan en la variable transformada. Obtendremos relaciones entre las medias, varianzas y desviaciones estándar 


de Xy Z. 


2 ; NE á = y . i 
Sean, sy y sy la media, varianza y desviación estándar de X, y Z, s% y sz estas mismas cantidades en la 
variable Z. Tenemos entonces: 


z; =a +bx; 
Por lo que: 
S z, = Y (a+ bx,)= na+bY x; 
i=] ¡=1 i=] 
o sea: 
z=a+bx (3.B.1) 
Despejando X se tiene: 
1 
x =-(z-a) 
b (3.B.2) 


“De nuevo, esto es evidencia del cambio en la tecnología, pero la lógica del procedimiento persiste. (Nota agregada a la 3”. ed). 
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Para la varianza utilizamos 3.B.1: 


z 2=2,a=bx =a+bx, —a—bx =b(x,-x) 


y de aquí que: 
(2, -Z° =b (x; -ry 
De donde: 
: > -z7 =% ES ar | 
n=1 3 n=1 2 

y, por tanto, 

=b (3.B.3) 
y 

1 
¡de z? (3.B.4) 


En el caso de la desviación estándar debemos tener en cuenta que ésta es siempre positiva, por lo que de 3.B.4 
obtenemos la relación, forzando que el resultado sea siempre positivo, es decir: 


1 
A (3.B.5) 
y 
sz =lblsy (3.B.6) 


Donde |b| es el valor absoluto de ¿. 
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Ejemplo 3.B.1. El profesor S midió 10 veces el tiempo que su hijo tarda en subir las escaleras de su departamento. 
Los tiempos (en segundos) fueron: 


2 10.5,.7.:7-1,8.7579:8.0,8.0; 10.1,11,3,8:8 


Solo con el propósito de ilustrar, puesto que los números obtenidos no son muy difíciles de manejar, 
sransformaremos las observaciones a: 


z, =-71+10x,  ¿=1,2,...,10. 


O sea: 
a=-71,b=10 


Los números resultantes son: 
34, 2, 0, 16, 8, 9, 9, 30, 30, 42, 17 


para los cuales: 


10 10 
| Y2z,=167 y $z% =4595 
R ¿1 i=l 


de donde: 


z=16.7; s% =200.677778 y sz =14.166078 


Utilizando nuestras ecuaciones encontramos: 


1 1 87.8 
x =—[z-(-71)]= — (z +71)= — =8. 
x m (-71)] TAG 71) a TAN 

1 1 
s =— s = Tog 200677778) = 2.006778 


Sy Tia + 
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La codificación también puede hacerse en una tabla de frecuencias. Puesto que en ellas el cálculo de medidas 
descriptivas se hace bajo la suposición de que todas las observaciones en una clase son representadas por el valor 
medio de la misma, basta codificar los valores medios de clase de la variable X para obtener ecuaciones similares 
a las establecidas de 3.B.1 a 3.B.6. 


Ejemplo 3.B.2. Considérese la siguiente tabla (ficticia) de frecuencias: 


v; f fe fo; 
5 3 15 75 
10 6 60 600 
15 8 120 1800 
20 5 100 2000 
25 2 50 1250 
$ 24 345 5725 
En la tabla: 
345 y 1 (345) 
x = — = 14.375 sy =— | 5725 ———— | = 33.288 
24 y x= 24 
Si transformamos los valores medios de clase a: 
4,=-15 +0, 
obtenemos la siguiente tabla: 
k; fi fil; fiu 
—10 3 —30 300 
—5 6 30) 150 
0 8 0 0 
5 5 25 125 | 
10 2 20 200 
y 24 -15 775 


De donde: 


z=-0.625 y s3 =33.288 
Nótese que podríamos haber obtenido los resultados para X directamente de las ecuaciones (3.B.2) y (3.B.4), 


puesto que con a=—15 y b=1: 


-i 


Capítulo 3 
CALCULO Y SELECCIÓN DE MEDIDAS DESCRIPTIVAS 


Meronos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Ejercicios 


3.1. Enseguida se presenta el número de terremotos ocurridos en cada una de las horas lunares (ángulo de 
la luna con respecto al epicentro) durante cierto tiempo 


Hora lunar (X) Número de terremotos ( Y) 
0 Fi 


VD 0 NAVU AUN m=e 


— — - 
N- O 
VUAN NOUA OOOD > wn O Nk ASOSI Un 


24 
FUENTE: Science, Vol. 82, pág. 524. 1935. 


N 


En la tabla se ha identificado a la hora con la letra X y al número de terremotos con la letra Y, o sea que x,=0, 
x,=1, x,=2,..., 2423, x5=24. Además, y, =7, y2=2,.w.> Y24=2) Y25=7- Con estos datos evalúe: 


25 17 5 j 
2% y Ji e 


a) = e) ¿=12 i) == 
25 8 5 y 
È 0, >) ($=) 

b) == f) 2 y NA 
5 8 8 
2 Ji 2 pama > X; Ji 

c) i=l g) {=l k) ¡=4 


d) =1? h) 2 ¡=4 


3.2. 


O. 


3.4. 


B:5. 


3.6. 


Capítulo 3 
CALCULO Y SELECCIÓN DE MEDIDAS DESCRIPTIVAS 


J ; r 2 2 2 2 z 
Use la notación de sumatoria, por ejemplo Xf +X; +2; = SN , ¿=1,...,3 para abreviar las 
siguientes expresiones: 


2) Xg FxXy Ftio Tias 

b) x, +x4 tig tig tiio 

c) x t? +3 + x% + x2 +x. 

d) -at 2 +3x3 +4x4. 

e) 8x, +7x, +6x3 +5x4 ták +3x5 +2x7 + xg —X10- 


X2 


AS 


Ne Xi Xs 
ae a EN e A 
3 4 5 


Demuestre las propiedades 3.2 y 3.4 presentadas en este capítulo. Es decir, pruebe que: 
a) D(x +y;)= 2x; +È 
i=] i=] j=l 


n 


b) A 


i=l i=l 
donde d y g son constantes. 
El gerente de una tienda de autoservicio que permanece abierta de las 6 de la mañana a las doce de la 


noche, cuenta un día el número de clientes que pasan por las cajas registradoras durante cada una de 
las 18 horas. Los resultados obtenidos son: 


21, 45, 30, 48, 56, 77, 60, 59, 23, 42, 36, 49, 73, 96, 90, 71, 42, 23. 
Calcule la media y mediana del número de clientes por hora. 
Calcule la media, moda y mediana del número de vehículos por minuto en el ejercicio 2.1. Localice 


estas medidas en el diagrama de puntos obtenido en el ejercicio 2.6 y comente sobre su posición 
relativa. 


La siguiente tabla de frecuencias presenta la distribución por edades de la población de la República 
Mexicana en 1970. 
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Número de individuos 


Edad (años cumplidos)* (£) 
[0, 5) 8 167 510 
[5, 10) 7 722 996 
[10, 15) 6 396 174 
[15, 20) 5 054 391 
(20, 25) 4 032 341 
[25, 30) 3 260 418 
[30, 35) 2 596 263 
[35, 40) 2511 647 
[40, 45) 1 933 340 
[45, 50) 1 637 018 
[50, 55) 1 192 043 
[55, 60) 1011 859 
[60, 65) 917 852 
[65, 70) 702 563 
[70, 75) 488 253 
75 o más 600 569 


FUENTE: IX Censo General de Población. Resumen General. 
S. I. C., D. G. E., México, D. E, 1972. 

* Intervalos de la forma [a, b) indican que se incluyen 
observaciones mayores o iguales que a, pero estrictamente 
menores que $. Este tipo de intervalo es adecuado aquí porque 
se registra la edad en años cumplidos. Es decir que el intervalo 
[0, 5) incluye desde recién nacidos hasta los que están a punto 
de cumplir 5 años. 


a) Dibuje el histograma de frecuencias relativas para esta tabla. 


b) Calcule media, moda y mediana de las edades. Suponga un valor medio de 80 para la clase “75 o 
más”. Comente sobre la posición relativa de estas medidas en el histograma. 


3.7. Calcule media, moda y mediana para el ingreso mensual por familia en la tabla de frecuencias del 
ejercicio 2.12. El ingreso promedio real de la clase “más de 12550” es 24385.46. 


3.8. En la tabla de distribución del ingreso analizada en el ejercicio anterior, si eliminamos las últimas 3 
clases, las restantes comprenden al 90.41 % de la población. Calcule media y mediana para ese grupo. 
Comente sobre las modificaciones que observa en la media y la mediana. 


3.9. En seguida se presentan datos de ingestión calórica por habitante en 12 países de América Latina y 12 
de Europa. 
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Calorías diarias consumidas por habitante 


América Latina 


Argentina Alemania Occidental 


Bolivia 2060 Alemania Oriental 3040 
Chile 2720 Dinamarca 3180 
Colombia 2280 España 2680 
Costa Rica 2610 Francia 3180 
R. Dominicana 2080 Inglaterra 3180 
Ecuador 1850 Italia 2940 
México 2620 Polonia 3140 
Panamá 2420 Portugal 2930 
Perú 2300 Suecia 2880 
Uruguay 3020 Suiza 2990 
Venezuela Yugoslavia 


FUENTE: Statistical Abstract of the United States. 1971. 


a) Dibuje diagramas de puntos que le permitan comparar la tendencia central y la dispersión de los 
datos. Comente los aspectos sobresalientes de los diagramas. 


b) Calcule la amplitud en cada uno de los conjuntos. 
c) Para cada grupo calcule media, mediana, desviación media, varianza y desviación estándar. 


| d) Compare la variabilidad de los dos conjuntos. 


3.10. Calcule varianza, desviación estándar y coeficiente de variación para el número de clientes por hora en 
el ejercicio 3.4. 


3.11. Calcule varianza, desviación estándar y coeficiente de variación para las edades de los habitantes de la 
República Mexicana presentadas en el ejercicio 3.6. 


3.12. Con los conteos de cromosomas del ejercicio 2.3 elaboramos la siguiente tabla de frecuencias: 


Número de cromosomas 


por planta Frecuencias (f) 

(23, 26] 5 
(26, 29] 40 
(29, 32] 27 
(32, 35] 11 
(35, 38] 3 
(38, 41] 3 
(41, 44] 
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Calcule media, mediana, varianza, desviación estándar y coeficiente de variación del número de 
cromosomas por planta usando la tabla. Calcule estas medidas en los datos individuales y compárelas. 


3.13. Para los datos del ejercicio 3.1, calcule las medias, medianas, varianzas, desviaciones estándar 
y coeficientes de variación. Dibuje el diagrama de dispersión de los datos y calcule covarianza 
y correlación. Interprete el signo y la magnitud de la correlación auxiliándose con el diagrama de 
dispersión. 


3.14. Enseguida se presentan los porcentajes de población y de inversión del gasto público del gobierno 
federal en cada una de las entidades federativas de la República Mexicana (1959-1970): 


q Población Inversión ; Población Inversión 

Entidad 00 (Y) Entidad X (y) 
Aguascalientes 0.7 0.5 Morelos 1.3 0.5 
B. California Norte 1.8 K9 Nayarit 1.1 0.6 
B. California Sur 0.3 1.0 Nuevo León 3.4 1.5 
Campeche 0.5 1.2 Oaxaca 4.5 4.1 
Chiapas 3.2 5.4 Puebla 5.2 1.1 
Chihuahua 3.3 4.8 Querétaro 1.0 1.0 
Coahuila 2.3 2.3 Quintana Roo 0.2 1.0 
Colima 0.5 0.8 S. Luis Potosí 2.7 2.0 
Distrito Federal 14.2 29.8 Sinaloa 2.6 8.2 
Durango 1:9 1.8 Sonora 2.3 25 
Guanajuato 4.7 21 Tabasco 1.6 2.1 
Guerrero 3.3 2.9 Tamaulipas 3.0 32 
Hidalgo 23 1,2 Tlaxcala 0.9 0.4 
Jalisco 6.8 31 Veracruz 29 3.6 
México Ka 3.3 Yucatán 1.6 1,2 
Michoacán 4.8 3.6 Zacatecas 2.0 13 


FUENTE: Wilkie, J. W. Statistics and National Policy, U. C. L. A Latin American Center. University of California, Los Angeles. 


a) Calcule X, sx Y, sy C. V. (X) y C. V. (Y). 


b) Dibuje el diagrama de dispersión de los datos y calcule syy y ryy: Interprete el signo y la magnitud 
de rxy con la ayuda de su diagrama. 


c) Observe cuidadosamente su diagrama de dispersión. El punto (14.2, 29.8), correspondiente al 
Distrito Federal, se aparta notablemente de la tendencia del resto de los datos. Elimine ese punto 
y repita los cálculos de los incisos a y b. Interprete los cambios en las medidas descriptivas. En 
particular observe la reducción en sp C. V. (Y) y rxy. 


ran araña que habitaba una casa vieja construyó una hermosa telaraña para atrapar 
i əz que una mosca se posaba en la telaraña y quedaba atrapada la araña la 
devoraba, de modo que cuando otra mosca viniera, pensaría que la telaraña era un lugar 
-zansar. Un día una mosca muy inteligente revol 
S e la araña apareció y dijo, “vamos, bi 
Pero la mosca era demasiado lista y dijo, “nunca bajo donde no veo otras moscas y no 


veo ninguna en tu casa”. Así que se alejó hasta llegar a un lugar donde había muchas 


ʻa 4 C N 
pítulo Otras MOSCAS una abeja que pasaba le dijo, 


“deténte es s un papel matamosca: OS están atrapadas”. No 


seas tonta, dijo la mosca, “están bailando”. Así que se pos dó pegada al papel con 


otras moscas. 


Moraleja: No hay seguridad en los números ni en ninguna otra cosa. 
(JAMES THURBER: FABULAS P; NUESTRO TIEMPO). 


Nociones elementales de probabilidad 


4.1. Introducción 


En el capítulo 1, al discutir el papel de la estadística en la investigación científica, se dijo que una de sus 
partes fundamentales, la estadística inductiva, tiene entre sus objetivos cuantificar la incertidumbre que 
caracteriza a todo proceso de razonamiento en el que se avanza de lo particular a lo general. Se dijo también 
que esta cuantificación se realiza mediante la aplicación de principios probabilísticos. En los capítulos 2 y 3 se 
presentaron las técnicas más usadas de la estadística descriptiva, por medio de las cuales tratamos de encontrar 
patrones que caractericen a un fenómeno (tablas de frecuencias y sus presentaciones gráficas) o cantidades 
que sinteticen la información contenida en los datos (medidas de tendencia central y de dispersión). En los 
capítulos que siguen se estudiará la parte inductiva de la estadística. Para situar los ejemplos del capítulo 1 
en el contexto de lo estudiado en los capítulos 2 y 3, supongamos que queremos investigar la producción de 
maíz por hectárea (ver sección 1.3) en una región donde hay 1000 agricultores, pero sólo se tienen los datos 
de producción de 100 de ellos, y con los datos disponibles se ha construido una tabla de frecuencias. Usando 
la tabla podríamos concluir (por ejemplo) que 80 % produce menos de 4 toneladas por ha; que 50 % produce 
entre 2.1 y 3.4 toneladas por ha, etc. Todas estas conclusiones serán absolutamente ciertas (si la información 
es verídica) para los 100 productores cuya información se tiene. Supóngase ahora que se nos pregunta qué 
porcentaje de los 1000 agricultores de la región producen menos de 4 toneladas por hectárea. ¿Podemos 
contestar que el 80 %, basándonos en los datos disponibles? Si así lo hacemos, ¿qué tan alejados estaremos 
del valor verdadero? Este tipo de preguntas se pueden contestar haciendo uso de las herramientas que nos 
proporciona la estadística inductiva, las cuales nos permiten cuantificar el grado de incertidumbre en nuestra 
respuesta. La cuantificación se lleva a cabo usando principios probabilísticos. Por esta razón dedicaremos 
este capítulo a estudiar las nociones de probabilidad que son indispensables para comprender las técnicas 
que presentaremos en los capítulos subsiguientes. Dados las características de este libro, iniciamos nuestra 
presentación con una breve introducción a la teoría de conjuntos, herramienta muy útil en el estudio de la 


sl. 


teoría de probabilidades. 
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4. 2. Conjuntos y su álgebra 
Toda noción básica en una ciencia es difícil, si no es que imposible, de definir. La de conjunto no es la excepción. 
De manera un tanto tautológica, pero razonable, entenderemos por conjunto cualquier colección de conceptos o de 
objetos perfectamente especificada. Por ejemplo, los alumnos de la clase introductoria de estadística, los 11 ríos del 
Estado de Sinaloa, las 6 primeras letras del alfabeto, y los números 1, 2, 3, y 4 son todos ellos conjuntos. Cada 
miembro de un conjunto será llamado un elemento del mismo. 
Para identificar a un conjunto usaremos letras mayúsculas. Por ejemplo, a los 4 conjuntos descritos arriba los 
identificaremos por las letras A, B, C y D, respectivamente. Para especificar sin ambigiiedad a un conjunto 
requerimos de una notación que lo describa. Se presentará enseguida dos maneras de describir un conjunto. 
La primera, útil si el conjunto tiene pocos elementos, consiste en listarlos dentro de un paréntesis. La segunda 
consiste en escribir dentro del paréntesis una regla que describa los elementos del conjunto. Refiriéndonos a 
los 4 conjuntos del párrafo anterior, podemos ilustrar las dos formas mencionadas. En el primero de ellos, 
supóngase que el curso tiene 8 alumnos: Úrsulo, Rudecindo, Bardomiano, Godofredo, Asdrúbal, Masiosare, 
Lúculo y Solsticio. Entonces el conjunto puede describirse, de acuerdo con la primera opción, como sigue: 
A=(Ursulo, Rudecindo, Bardomiano, Godofredo, Asdrúbal, Masiosare, Lúculo, Solsticio). 
Usando la segunda opción se escribiría: 


A=(x]x es alumno del curso introductorio de estadística). 


Lo que debe leerse como: “A es el conjunto de x, tales que x es alumno del curso introductorio de estadística”. La 
barra vertical quiere decir “tal que”. 


En el caso de los 11 ríos del Estado de Sinaloa, usando la primera forma tenemos: 
B=(Choix, Fuerte, Sinaloa, Mocorito, Culiacán, San Lorenzo, Elota, Piaxtla, Presidio, Baluarte, Cañas). 
Y usando la segunda: 
B=1Íx[x es uno de los ríos del Estado de Sinaloa}. 
Por lo que toca al conjunto C, integrado por los primeras 6 letras del alfabeto, se tiene: 
C=ja, b,c, d, e, f} 

o bien: 

C=(x]x es una de las primeras 6 letras del alfabeto). 
Finalmente, el conjunto D se representa por: 

D=(1, 2, 3, 4). 


o bien: 


D= (x|x es uno de los primeros cuatro enteros positivos). 
a los cuatro casos anteriores los conjuntos tienen pocos elementos y es fácil listarlos. En algunas situaciones 
es imposible. Considérese, por ejemplo, el conjunto de todos los números en el intervalo [0, 1). Este 


junto es fácil presentarlo con la segunda opción, como sigue: 


A=Axl0<x<1), 


ə es imposible listar individualmente sus elementos. 


alo 4.1. Sean A={xl0<x<1}; B={xl0 < x <1}; C ={xl0 < x <1} y D= {xl0 < x < 1} . Entonces: 
a0 ¢40EB0ÉCy0ED 

b14£41f£B1ECy1ED 

NS E A, 0.5€E B,0.5€ C,y 0.5€ D 

d2EA2EB2ÉCy2ÉD e 


ición 4.1. (Igualdad de conjuntos). Dos conjuntos A y B son iguales sí y sólo sí tienen los mismos elementos. 
ribiremos entonces A = B. En caso contrario se escribirá A # B. ¢ 


En la definición 4.1 debe notarse que el orden en que se listan los elementos es irrelevante. 


jemplo 4.2. Sean los conjuntos A= (célula, mariposa, reloj); B=(célula, reloj) y C= {mariposa, reloj, célula). 
acuerdo con la definición 4.1 es claro que A # B, A = Cy B + C. + 


finición 4.2. (Subconjunto). Sean A y B dos conjuntos. Si todo elemento de A es también un elemento de B, 
emos que A es un subconjunto de B. Simbólicamente escribiremos A C B. 6 


aplo 4.3. Si consideramos los conjuntos A, B y C del ejemplo 4.2, tenemos que BC A, AF B,AC Cy 
CC Aen donde A E B indica que A no es subconjunto de B. 4 


Definición 4.3. (Subconjunto propio). Si A C C, pero A # B, diremos que A es un subconjunto propio de B. 6 
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Ejemplo 4.4. En el ejemplo 4.2, B es un subconjunto propio de A, ya que B C A pero B A A (puesto que 
A É B). En cambio A no es un subconjunto propio de C, puesto que A C C pero A = C. 4 


Definición 4.4 (Conjunto vacío). El conjunto vacío es un conjunto que no contiene elementos. Se denota por 
la letra griega ġ (fi minúscula). 6 


Ejemplo 4.5. Sea A = (x|x es un felino con 10 patas), entonces es claro que A = ġ. 6 


En todas nuestras discusiones habrá un conjunto, del cual todos los conjuntos de nuestro interés son subconjuntos. 
A ese conjunto lo llamaremos el Conjunto Universal, y lo denotaremos por la letra U. 


Diagramas de Venn. Los conjuntos, sus relaciones y las operaciones algebraicas que con ellos se realizan pueden 
representarse gráficamente mediante lo que llamamos Diagramas de Venn-Euler, o simplemente Diagramas de 
Venn. En un diagrama de Venn, el conjunto universal se representa por un rectángulo, 

y los conjuntos de interés por círculos (o por figuras irregulares) dentro del 
rectángulo. En la Figura 4.1 se ha dibujado un conjunto universal U y tres 
subconjuntos A, B y C. Es claro que B es un subconjunto propio de A, y que 

C no tiene elementos en común con A ni con B. 


Leonhard Paul Euler 
1707-1783 


Figura 4.1. Diagrama de Venn mostrando un conjunto universal y algunos subconjuntos. 


Ejemplo 4.6. Sean U = (1, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12}; A = {1, 2, 3, 
4); B = (4,5, 6); C = (7, 8,9, 10, 11,12) y D = (11, 12}. 


es í ; John Venn 
La representación de estos conjuntos usando un diagrama de Venn es: 1834-1923 


que A y B tienen un elemento en común, que D C Cy que A y Cno tienen elementos comunes. 6 


de conjuntos. A continuación definiremos tres operaciones con conjuntos: la unión y la intersección y 

complemento de un conjunto con respecto a su conjunto universal. El resultado de cada una de estas operaciones 

también un conjunto, el cual es subconjunto (no necesariamente propio) del mismo conjunto universal que 
iene a aquellos entre los que se hizo la operación. 


ición 4.5 (Unión de conjuntos). Sean A y B dos conjuntos y U su conjunto universal. El conjunto que 
integrado por los elementos que pertenecen a A, a B o a ambos, es la unión de A y B. Dicho de otro modo, 
la unión de A y B (notación: A U B) es el conjunto cuyos elementos pertenecen por lo menos a uno de los 
juntos A o B. Simbólicamente podemos escribir: A U B = {x|x es elemento de A o x es elemento de Bo x es 
to de ambos}. 6 


un diagrama de Venn la unión de dos conjuntos se representa, como en la Figura 4.2, por el área sombreada. 


Figura 4.2. El área sombreada representa la unión de A y B. 
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operación de unión puede generalizarse a más de dos conjuntos. Sean A, A)...» A,, 7 conjuntos, subconjuntos 


un conjuntos universal U. La unión de ellos (a UA, U-"UA, =U 4) se define como: U 4; = [xx es 
i=l ¡=1 
to de al menos uno de los conjuntos A, i = 1, 2,..., n}. 


4.8. Sean U ={x|2<x <12}; A=[x]4<x<6); B=[x]5<x<12); C=([x]8<x<10.5). 
os entonces: 
AUB=(x|4<x<8) 
AUC=([x|4<x<6y8<x<10.5) 
BUC=(x|5<x<10.5) 


AUBUC=(x|4<x<10.5) $ 


Definición 4.6 (Intersección de conjuntos). Sean A y B dos conjuntos y U su conjuntos universal. El conjunto 
integrado por los elementos que pertenecen a ambos conjuntos es la intersección (notación: A N Bo simplemente 
AB) de A y B. Es decir, que sólo pertenecen a A N B los elementos que son comunes a ambos conjuntos. 
Simbólicamente podemos escribir: A N B = {x|x es elemento de A y x es elemento de B. + 


En la Figura 4.3 se grafica la intersección de dos conjuntos: 


ANB 


Figura 4.3. El área sombreada es la intersección entre A y B. 
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EF.. 


Nótese que si dos conjuntos no tienen elementos en común, entonces su intersección no contiene element 
por tanto es el conjunto vacío. En un diagrama de Venn tendríamos: 


oO 


Figura 4.4. La intersección de dos conjuntos sin elementos en común es el conjunto vacío. 


Definición 4.7 (Conjuntos ajenos o mutuamente excluyentes). Sean A y B dos conjuntos, y sea U su conjunto 
universal. Si A N B = p, diremos que los conjuntos A y B son ajenos o mutuamente excluyentes. 4 


Ejemplo 4.9. Sean U = (*, Q, +, 0, Ô, æ, À}; A = {Q, 0, ô}; B = {*, Q, +, o}; C = [Ó, 0,4). Entonces A N B = 
(Q. AN C= fðjy BN C=¢.¢ 


La operación intersección puede generalizarse a cualquier número de conjuntos. Sean Ap Az.. A, subconjuntos 


de un conjunto universal U. La intersección de ellos (a n4n-nA,=U 4) se define como U 4, = (xx 
i=l i=l 
es elemento de todos y cada uno de los conjuntos A; ¿= 1, 2,..., 7}. 
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Ejemplo 4.10. Suponga que en el curso de estadística se tienen diez estudiantes, los cuales han presentado dos 
amenes. En la tabla siguiente se presentan las calificaciones obtenidas por los diez alumnos y el sexo de cada 
mo de ellos. El conjunto universal está integrado por los números asignados a los estudiantes, los que servirán 


para identificarlos, es decir: 


U = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10) 


Alma os Calificación en Calificación en 
examen l examen 2 
1 F 8 9 
2 M 6 8 
4 F 8 6 
6 M 7 9 
7 F 8 8 
8 M 9 - 
9 M 8 6 
| 10 F 7 > 


Se A el conjunto de estudiantes que obtuvieron 8 o más en el primer examen, y sea B el de los que obtuvieron 
| . . 
esas calificaciones en el segundo, entonces: 


Los estudiantes que obtuvieron una calificación de 8 o mayor en los dos exámenes integran el conjunto A N B. 
ANB=(1,7) 
Los conjuntos Cy D no tienen elementos en común, por tanto: 
CND=4 
Los estudiantes de sexo masculino que obtuvieron 8 o más en el primer examen forman el conjunto A N D. 
AN D= (5,8, 9) 
Los estudiantes de sexo masculino que obtuvieron 8 o más en los dos exámenes son los miembros de A N BN D. 


ANBND=4 


«DY 
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Las estudiantes de sexo femenino que obtuvieron 8 o más en los dos exámenes forman el conjunto A A 


NC. 
ANBNC=[(1,7) 


En seguida se presenta un diagrama de Venn que ilustra los resultados precedentes. En el diagrama, 
intersección que no muestra números es el conjunto vacío. 


Definición 4.8 (Complemento de un conjunto). Sea A un conjunto y sea Usu conjunto universal. El complemento 
de A (notación: A”) es el conjunto integrado por los elementos de U que no pertenecen a A. Simbólicamente 
puede escribirse: A“ = {x|x es elemento de U, pero x no es elemento de 4}. 6 


Ejemplo 4.11. Sean U = {x|—8 < x < 63} y A=(x|0<x<63), entonces: 


A ={x|-8<x<0}. e 
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£3. Experimentos aleatorios, espacios muestrales y eventos 


s estadística, los conjuntos de interés son colecciones de observaciones obtenidas estudiando el comportamiento 
un fenómeno, ya sea en estado natural o bien bajo nuestro control. Para identificar el proceso mediante el 
obtenemos nuestros datos, definimos el término experimento. 


efinición 4.9 (Experimento). Un experimento es el proceso mediante el cual obtenemos una observación. 6 
menos conceptualmente es posible imaginar experimentos en los cuales el resultado puede anticiparse. En 


dominio de la estadística estos experimentos son de poco o ningún interés. Los experimentos de los que nos 
=paremos reciben el nombre de experimentos aleatorios. 


Definición 4.10 (Experimento aleatorio). Un experimento aleatorio es aquél cuyos resultados no pueden 
'predecirse antes de su realización y, por tanto, están sujetos al azar. 6 


Definición 4.11 (Espacio muestral). El conjunto integrado por todos los resultados posibles de un experimento 
_secibe el nombre de espacio muestral. Lo identificaremos con la letra M. 6 


Ejemplo 4.12. Considérense los siguientes experimentos aleatorios: 


a) Se pregunta a un estudiante del curso introductorio de estadística su opinión sobre el profesor del curso. 
Se registra la respuesta como favorable (F) o desfavorable (D). El espacio muestral para el experimento 
es: 


M = {F, D} 


b) Se aplica un insecticida a tres larvas, y al cabo de 24 horas se observa si están muertas (m) o vivas (v). 
Aquí se tienen 8 resultados posibles, y el espacio muestral es: 


M = {vvv, mvv, vmv, vvm, vmm, mum, mmv, mmm) 


c) Entrevistamos a 10 agricultores preguntándoles si utilizan potasio en su fertilización. Se reporta el 
número de ellos que sí usan potasio. Los 11 resultados posibles integran el espacio muestral. 


M= 10, des ye 57 4, $, 6, A 8, % 10) 
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d) En una encuesta se pregunta a personas mayores de 30 años si creen en la existencia de duendes con pie | 
de atleta. El experimento termina con la primera persona que da una respuesta afirmativa. Se registra el 
número de individuos entrevistados. En este caso cualquier entero positivo es un posible resultado. Por | 
lo tanto: | 


M = (1, 2, 3, 4,...) 


Los puntos suspensivos indican el hecho de que cualquier número entero positivo, no importa cuán 
p p q p p 
grande, puede ser el resultado del experimento. 


e) Se toma un litro de leche y se determina en el laboratorio el porcentaje de agua por volumen. El espacio 
muestral en este caso es: 


M=1x10<x<100) 


Donde x es el porcentaje de agua en el litro de leche examinado. 


f) En una muestra de sangre de un individuo se determina el número de glóbulos rojos y glóbulos blancos 
por centímetro cúbico. Puesto que se registran dos características, denotaremos por X el número de 
glóbulos blancos y por Y el número de glóbulos rojos. 


M= [( y) [x=1,2,3,...5 y = LB) 


g) Se mide el tiempo que un individuo tarda en recorrer 100 metros y su capacidad respiratoria. En este 
caso también se tienen dos variables, el tiempo (7) y la capacidad respiratoria (C). 


M =4(c,c)]1>0,c > 0) r 


Un aspecto que conviene destacar es que, dado un experimento, pueden construirse diversos espacios muestrales. 
Así, en el caso b), se ha optado por un espacio muestral que describe en detalle todos los posibles resultados 
del experimento. Se especifica no sólo cuántos insectos muertos hay, sino cuáles de ellos. Ésta puede ser una 
descripción excesivamente prolija (aunque seguramente no lo es desde el punto de vista de los insectos) si 
únicamente nos interesa el número de insectos muertos. Si éste es el caso, podríamos tener un espacio muestral 
simplificado, como sigue: 


M = {0, 1, 2, 3} 


En el ejemplo 4.12 se presentaron espacios muestrales de muy diversa complejidad. En el primer caso sólo 
pueden clasificarse las opiniones en favorables o desfavorables. En el segundo tenemos 8 o 4 elementos, según se 
elija la primera o la segunda opción. En el experimento de los 10 agricultores se tienen 11 posibles resultados. En 
los tres casos el número de elementos del espacio muestral es finito, puesto que el total resultante de contar los 
elementos es igual a un número entero no negativo. Por lo anterior, estos espacios reciben el nombre de espacios 
muestrales finitos. El caso d) se complica un poco, dado que el número de resultados posibles no es finito. Sin 
embargo, los resultados pueden ordenarse en una sucesión (0, 1, 2, 3,...). En este caso decimos que el espacio 
muestral es infinito denumerable. Estas cuatro situaciones son ejemplos de espacios muestrales discretos. 


finición 4.12 (Espacio muestral discreto). Un espacio muestral integrado por un número finito o infinito 
enumerable de elementos es un espacio muestral discreto. 4 


sontinuando con el ejemplo 4.12, examinamos ahora la situación descrita en e). Nótese que ahora no sólo no 
finito el número de elementos, sino que tampoco pueden ordenarse éstos en una sucesión. Tenemos entonces 
ejemplo de lo que llamaremos espacio muestral continuo. 


Jefinición 4.13 (Espacio muestral continuo). Si un espacio muestral contiene a todos los elementos en uno o 
ios segmentos de la línea real, lo llamaremos espacio muestral continuo. 6 


casos fì y g) tienen como único propósito generalizar los conceptos anteriores a situaciones donde se desea 
medir dos características simultáneamente. En f se ilustra el concepto de un espacio muestral bidimensional 
iscreto, y en g) el de un espacio bidimensional continuo. 


cualquier experimento es de suma importancia especificar el espacio muestral y, en ocasiones, ciertos 
bconjuntos del mismo tienen importancia especial. En el caso e) del ejemplo 4.12, supóngase que un litro 
de leche con más de 90 % de agua es inaceptable para quien realiza el análisis. El subconjunto A (A C M) está 
definido por: 


A=([x|90<x<100) 


'Subconjuntos de M de este tipo serán llamados eventos en el espacio muestral M. 


Definición 4.14 (Evento). Un evento es un subconjunto de un espacio muestral. 6 


A menudo será conveniente dividir el espacio muestral en cierto número de eventos, digamos Ay, Az»... Ap 
de tal manera que A; N A; = ġ para cualquier par de eventos (es decir, que los eventos sean mutuamente 


| n 
excluyentes), y U 4, =4, U 4,U-"U 4, = M. Una división con estas características será llamada una partición 
| i=l 


| del espacio muestral. 


Definición 4.15 (Partición de un espacio muestral). Sean A}, Æ»... A, 2 eventos (subconjuntos) de un espacio 


muestral M. Si A, N A; = para cualquier par de eventos y YA = M, diremos que los eventos A, A)...» A, 
forman una partición del espacio muestral M. 4 
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Ejemplo 4.13. Considérese el experimento consistente en medir el porcentaje de humedad relativa en un 
invernadero. Cualquier número (dependiendo de la precisión con que se mida) entre 0 y 100 es un posible 
resultado del experimento. Es decir: 


M ={x|0<x<100} 


Sean: 
A={x|0<x<30}; B={x|30<x<70}; C={x|70< x <100} 
Claramente: 
ANB=¢ġ; ANC=Q; BAC=¢ 
y 


AUBUC=M 


Por lo que A, B y C forman una partición de M. 


4.4. Población y muestra 


En relación con el concepto de experimento aleatorio, es conveniente introducir los términos población 
y muestra. Se ha mencionado antes que un experimento aleatorio es el procedimiento mediante el cual 
obtenemos las observaciones sobre las que opera la estadística. Es fácil ver que hay experimentos aleatorios 
que pueden repetirse indefinidamente. Así, el experimento consistente en registrar el sexo de cada recién 
nacido en los hospitales de México puede repetirse constantemente en el tiempo. En cambio, el experimento 
consistente en anotar las edades de los 10 estudiantes presentes en un salón de clases sólo puede repetirse 
10 veces. En el primer caso, si queremos determinar la proporción de individuos de cada sexo que nacen 
en los hospitales de México en un periodo de 10 años, tenemos la opción de revisar los registros de todos 
los hospitales en esos 10 años, o bien revisar los registros de unos cuantos de los hospitales de México y, 
con esa información, formarnos una idea de las proporciones en todos los hospitales. Tenemos entonces 
dos recolecciones diferentes de observaciones: una formada por todos los resultados de nuestro interés, 
y otra formada sólo por una porción de ellos. Los términos estadísticos para estas dos recolecciones son, 
respectivamente, población y muestra. 


Definición 4.16 (Población). Una población, desde el punto de vista estadístico, es el conjunto de resultados 
potenciales de un experimento aleatorio, si éste se repitiera en todas las unidades a las que se quiere investigar. 
También se le llama Población Objetivo. 6 


Definición 4.17' (Muestra). Una muestra de una población estadística es el conjunto de resultados que se 
recolectan en una investigación. Una muestra debe ser un subconjunto de la población. 6 


4.5. Probabilidad 
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i En un texto elemental como éste es inadecuado intentar una definición estricta del concepto de probabilidad. La 

- Sermulación axiomática de la teoría de probabilidades requiere niveles de abstracción y competencia matemáticas 
mayores que los que cabe suponer en un estudiante de un curso introductorio de estadística. Por otra parte, las 
definiciones supuestamente elementales son de tipo circular. Por estas razones evitaremos dar una definición de 
probabilidad, y apelaremos a nociones intuitivas que nos permitan desarrollar los conceptos necesarios para el 
smanejo de las técnicas de inferencia estadística que se presentarán en capítulos posteriores. 


En el lenguaje cotidiano, el concepto de probabilidad está indisolublemente ligado al de frecuencia relativa. 
Decimos que es poco probable enriquecerse jugando a la ruleta contra un casino porque los casos en que 
esto ocurre son poco frecuentes. Para referirnos a situaciones menos extremas imaginemos un juego entre dos 
personas a las que identificaremos con las letras B y C. Cada una de estas personas elige un nombre, y ambos 
se apostan en una esquina de la ciudad preguntando su nombre a cada transeúnte que acierte a pasar por allí. 
El juego termina con el primer individuo entrevistado cuyo primer nombre coincida con uno de los nombres 
escogidos por los jugadores. Gana aquel que haya elegido el nombre del último entrevistado. Si B elige el 
sombre Belarmino y C el nombre Juan, es natural que pensemos que C tiene mayores posibilidades de ganar, 
puesto que el nombre Juan es más común (frecuente) que el nombre Belarmino. 


Esta asociación entre los conceptos frecuencia relativa y probabilidad será la base de nuestra presentación de los 


principios probabilísticos. 


Estabilización de las frecuencias relativas. Un problema asociado con el uso de frecuencias relativas es su 
variabilidad. Imaginemos un experimento aleatorio con cierto número de resultados posibles, el cual se repite 
=a gran número de veces. Si después de cada 10 repeticiones obtenemos las frecuencias relativas para cada uno 
de los eventos, observaremos que estas frecuencias varían en casi todos (o todos) los casos. Refiriéndonos al 
juego entre B y C, descrito líneas arriba, supóngase que continuamos el experimento observando las frecuencias 
relativas de los dos nombres seleccionados por B y C. El espacio muestral incluye a todos los nombres posibles, 
pero para nuestros fines es suficiente considerar una partición del espacio muestral en tres eventos. 


Sean éstos: 
A;: el conjunto de individuos cuyo primer nombre es Belarmino. 
A): el conjunto de individuos cuyo primer nombre es Juan. 


Az; el conjunto de individuos cuyo primer nombre no es Juan ni Belarmino. 


Entonces: 


M=A,UA,UA, 
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Suponga que, después de 10 repeticiones del experimento, encontramos que tres entrevistados llevan como 
primer nombre Juan, ninguno el de Belarmino y siete otro nombre cualquiera. Las frecuencias relativas de A}, A) 
y Az son 0.3, 0.0 y 0.7. Si continuamos con el experimento y calculamos las frecuencias relativas después de 20 
intentos, obtendremos casi seguramente valores diferentes de los anteriores. Sin embargo, si el experimento se 
repite un número muy grande de veces, observaremos que las fluctuaciones en las determinaciones sucesivas se 
vuelven cada vez más pequeñas. A esta estabilización de frecuencias relativas, cuando el número de repeticiones 
de un experimento es muy grande se le llama regularidad estadística y es típica de los experimentos aleatorios. 


Ilustraremos esta característica de los experimentos aleatorios con un experimento real en el ejemplo 4.14. 


Ejemplo 4.14. El experimento consistió en calcular la frecuencia relativa de la letra “e” en un texto literario. 


« ” 


Para ello se tomaron grupos de 50 letras contando en cada uno el número de veces que aparece la letra “e” en 
cada grupo. El libro usado para el experimento es “Cuentos del Desierto” de Emma Dolujanoff, editado por 
la Universidad Nacional Autónoma de México. Los resultados se presentan usando una escala muy fina en la 
Figura 4.5. En el eje de las abscisas se tiene el número de letras examinadas (en miles) y en el de las ordenadas la 
frecuencia relativa de la letra “e”. La estabilización de la frecuencia relativa ocurre paulatinamente como sigue: en 
las primeras mil letras la variación máxima entre dos frecuencias relativas es de 0.0300; entre mil y 2000 letras 
la variación máxima es de 0.0057; entre 2000 y 5000 la variación máxima es de 0.0023, y entre 5000 y 10 000 
letras de solo 0.0011. La estabilización parece ocurrir alrededor del valor 0.127, lo que se aproxima bastante a 


los resultados obtenidos en estudios más extensos. 4 


Pi 
0.140 
0.138 
0.136 
0.134 
0.132 
0.130 
0.128 
0.126 
0.124 
0:122 
0.120 
0.118 
0.116 
0.114 
0.112 


1 2 3 4 5 6 7 8 9 10 11 12 
Miles de letras 


Figura 4.5. Estabilización de la frecuencia relativa de la letra “e”. La escala en el eje de las 
abscisas es de miles de letras. 


modelo probabilístico basado en la frecuencia relativa. En lo que sigue se supondrá que, dados un espacio 
al y una partición del mismo, se tienen ya frecuencias relativas estabilizadas para los eventos de la 
ón. En nuestras discusiones, cuando se diga que la probabilidad de un evento A es la cantidad P(A), deberá 
e que P(A) es la frecuencia relativa estabilizada del evento A. Esto no debe tomarse como una definición de 
abilidad; simplemente diremos que la frecuencia relativa del evento A es una es una medida de una cantidad 
ocida que es la probabilidad del evento A. 


sten otras definiciones elementales de probabilidad, siendo la más común la 
da probabilidad a priori. Según esta definición, si un experimento puede 
mer 7 resultados mutuamente excluyentes e igualmente posibles, y si la unión 
de “2” de ellos (considerados como subconjuntos del espacio muestral) es el 
wento A, entonces P(A) = aln. Esta definición tiene dos problemas obvios: 
ro, que es circular, puesto que el término “igualmente posibles” es un 
cepto evidentemente relacionado con lo que se quiere definir y, segundo, 
cómo decidir que todos los eventos son igualmente posibles? Por otra parte, 
uno está dispuesto a suponer que, por ejemplo, al lanzar una moneda las 
caras de ésta son eventos igualmente posibles, entonces, de acuerdo 

con la definición, la probabilidad a priori de cada una de ellas es 0.5. Como 

etro ejemplo considérese el lanzamiento de un dado. Si suponemos que 
ocurrencia de cada una de las 6 caras son resultados igualmente posibles, 


t 


] ES ms vts 3 Pierre Simon Laplace 
entonces el evento “número non” tiene probabilidad 5" 1749-1827 


s dos ejemplos presentados son clásicos en la teoría de probabilidades basada en la probabilidad a priori, e 
astran una característica de esta definición: las aplicaciones de la probabilidad a priori se refieren casi exclusivamente 
experimentos idealizados, con una estructura similar o derivada de la de los juegos de azar. Por el contrario, el 
enfoque usando frecuencias relativas es eminentemente práctico. Sin desconocer la importancia teórica del 
enfoque apriorístico, la discusión que sigue está sustentada en la estabilización de las frecuencias relativas. En 
sodo caso, las siguientes propiedades deben cumplirse en cualquier espacio muestral: 


- Estas tres propiedades son consecuencia, en nuestro contexto, de la identificación de la probabilidad con la 
frecuencia relativa estabilizada, pero son también consistentes con la idea de probabilidad a priori. 
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Ejemplo 4.15. Supóngase que, estudiando las alturas de planta en una variedad de maíz, hemos establecido cinco 
clases para dichas alturas, y se tienen las siguientes frecuencias relativas para las clases: 


Clase Altura (en cm) Frecuencia relativa 
B, (0, 50] 0.05 
B, (50, 100] 0.20 
B, (100, 150] 0.30 
B; (150, 200] 0.40 
B, Más de 200 0.05 


Es claro que B,, B,, B3, B4 y B; forman una partición de M, donde si X representa la característica “altura de 
planta”, se tiene: 


M={x|0<x} 


y, además, 


P(M)=1; 0< P(B;)<l; i=1,2,3,4,5 


Sea C={x]0< x< 100} , entonces C = B, U B, . Puesto que B, N B, =$, tenemos, por (4.17): 


P(C)= P(B, U B,)= P(B, )+ P(B,)=0.05 +0.20 =0.25 


Es decir, que la probabilidad de que una planta de esa variedad mida 100 cm o menos es 0.25. Similarmente, la 
probabilidad de que una planta mida más de 150 cm es 0.45. En este caso nos referimos al evento: 


D={x|x>150} 


y se tiene que D = B; U B; y B4 N B; =ġ, por lo que: 


P(D)=P(B,)+P(B,)=0.45 


Ejemplo 4.16. En una raza de ratones se tiene, por lo que toca al color del pelaje, dos clases de los mismos: negros 
y cafés. Los negros son, genéticamente hablando, de dos tipos (BB y Bb), y los cafés de un solo tipo (bb). De la 
teoría genética establecida se sabe que si se cruzan dos ejemplares negros tipo (Bb), pueden obtenerse los 3 tipos 
de ratones con las siguientes probabilidades. 


Probabilidad de cada tipo 
BB Bb bb 
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El experimento consistente en observar el resultado de una cruza como la anterior tiene entonces el siguiente 
espacio muestral: 


M = {BB, Bb, bb) 


zon probabilidades: 


1 1 1 
P({BB}) = Fi P((Bb)) = n P({bb}) = F 


E uso del paréntesis | } es para destacar el hecho de que la probabilidad se mide sobre eventos, es decir, subconjuntos de 
a espacio muestral y, por tanto, se aplica sólo a conjuntos, independientemente de que, como en este caso, los conjuntos 
sgan sólo un elemento cada uno. En lo que sigue, a menos que algo haya sido definido como un conjunto, 
sespetaremos esta convención. 


Claramente, {BB}U {Bb}U {bb} =M y los tres subconjuntos son mutuamente excluyentes. También es claro 
que: 


P(M)= P((BBN + P({Bb})+ P({bb})=1 


Mótese que ésta no es la única partición posible de M. Si nos interesa exclusivamente establecer que el ratón 
sesultante es negro (N) o café (C), tenemos: 


{N} = {BB}U {Bb} y {C} = {bb} 


Por lo que: 
P({N})= PBB} + PUB) = 
pic} = pdw == 
Y_daramente: 


M={N}U{C} + 


Algunas leyes probabilísticas. En muchas ocasiones ocurre que la probabilidad de un evento puede calcularse 
Sicilmente usando las probabilidades (conocidas) de otros eventos. En particular esto sucede si el evento en 
cuestión puede expresarse como la unión de dos eventos o como el complemento de un evento. El cálculo de 
las probabilidades en estas dos situaciones se simplifica considerablemente usando las reglas que se presentan a 
continuación. 


egla 1. (Probabilidad de la unión de dos eventos). Sean A y B dos eventos. La probabilidad del conjunto que 
sesulta de la unión de A y Bes: 
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P(AUB)=P(A)+ P(B)-PCAB). 


Dicho en palabras: la probabilidad del conjunto AU Bes igual a la probabilidad del conjunto A, más la probabilidad 
del conjunto B, menos la probabilidad del conjunto A N B. 


La regla puede verificarse fácilmente mediante el diagrama de Venn que se presenta en la Figura 4.6. 
Si hacemos que las áreas de los eventos en el diagrama correspondan a la magnitud de las probabilidades, puede 
verse que el área sombreada, que corresponde al evento A U B, se obtiene sumando el área de A con la de B, y 


restando el área que corresponde a A N B. 


Regla 1.a. Si A y B son dos eventos mutumente excluyentes (AN B) =p, entonces: 


P(AUB)=P(A)+P(B) 


Figura 4.6. Probabilidad de A U B. 


Esta regla es un caso particular de la regla 1, y puede deducirse también de (4.17), puesto que (4.15), (4.16) y 
(4.17) implican que P($)=0. 


Ejemplo 4.17. En el ejemplo 4.16 se calcularon las probabilidades de ocurrencia de un ratón negro (N) y de un 
ratón café (C): 


a m 
PUND=7 pich=; 


Supóngase además que cierta enfermedad se presenta en esa raza de ratones con una frecuencia de 7/32. Es 
decir que, si representamos por £ al evento “ratón enfermo”, entonces P(E) =7/32. Se sabe además que la 
q p P q 


JEn- 
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d de un ratón café con la enfermedad es 5/32, y la probabilidad de un ratón negro con la enfermedad 
Es decir: 


anD =4; P(CNE)=2 
32 32 


a estos datos, ¿cuál es la probabilidad de que un ratón resultante de la cruza sea negro o tenga la enfermedad? 


o con la regla 1 tenemos: 


P(NUE)=P(N)+P(E)- Hi 
4 32 32 32 


A A o 
13 Y ds 


ls 2. Sea A un evento de un espacio muestral M. La probabilidad del conjunto complemento de A es: 
Pl4)=1-P(4) 
a regla se prueba con facilidad, puesto que M = AU A" y ANA =¢ de donde, por 4.16 y 4.17: 


P(M)=1=P(4U4A)=P(4+P(4") 


PÍ(A*)=1-P(4) 


4.18. En el ejemplo 4.16 tenemos el espacio muestral M = {N,C}, donde PN) =Ż y P(c)=>. 
, M=NUC=NUN"* 


p(N*)=p(c)=1-P(N)=2 
á æ% 
Probabilidad condicional 


t menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otros. Como un ejemplo 
idérense las calificaciones de un estudiante en dos cursos, uno preliminar y otro avanzado de la misma 


1 


METODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


materia. Es razonable suponer que la calificación que obtenga en el curso avanzado depende en cierta medida 
de la que haya obtenido en el curso preliminar. Otro ejemplo sería la incidencia de ciertas enfermedades en 
los sexos masculino y femenino. Esta dependencia de unos eventos con respecto a otros nos lleva a formular el 
concepto de probabilidad condicional. Para motivar la definición recurriremos al ejemplo ya considerado de la 


cruza de ratones. Del ejemplo 4.17 tenemos: P(N) = A P(c)= i ¿PONTE > y P(E)= 2 


25 
Si S = E", tenemos que el evento “ratón sano” tiene una probabilidad P(S) == . Con estos datos podemos 
construir la siguiente tabla de doble entrada. 32 


E S 
24 
N 2/32 22/32 32 
8 
G 5/32 3/32 a 


7/32 25/32 


Donde P(NNS)=P(N)-P(NNE)= 4-4 =% 
32 32 <= 


Aunque la proporción de enfermos en toda la población es 7/32, es evidente que esa proporción no es la 
misma para los ratones cafés que para los negros. Restringiendo nuestra atención a los negros, calculemos 
la probabilidad de un ratón enfermo en ese grupo, es decir, la proporción de ratones enfermos dentro de los 


24 š ' z 
negros. De un total de — que son negros, 2/32 están enfermos, es decir que la proporción de ratones enfermos 
32 


2 
entre los negros es (2/32)/(24/32)= T . Escribiremos entonces: 


PRIN == 
24 


El símbolo P(£/N) lo leeremos como “la probabilidad condicional de E dado N ”. Similarmente, para 
calcular P(E /C), observamos que de los 8/32 que son de color café, 5/32 tienen la enfermedad, por lo que: 


Estos resultados reflejan el hecho de que la enfermedad es más frecuente entre los ratones cafés que entre los 
negros. De hecho, si se nos pregunta la probabilidad de que un ratón esté enfermo sin especificar el color, 
diremos que es 7/32=0.21875, pero si se nos pregunta la probabilidad de que esté enfermo dado que es negro, la 


respuesta es 2 = 0.083 ; y si se nos pregunta la probabilidad de que esté enfermo dado que es café, la respuesta 


es == 0.625 . Por lo anterior es razonable pensar en la probabilidad condicional como en una probabilidad 


corregida por información adicional. 
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Es forma análoga pueden calcularse las siguientes probabilidades: 


P(NIE)=2 y PCIE)= 


22 
PANID Pee 
25 25 


Biésese que en todos los casos, haciendo la correspondencia de letras pertinente, se tiene el siguiente resultado: 


P(AB) 


P(AIB)= (5 


5 por ejemplo, 


P(ENN)_ 2/32 _ 2 
P(N) — 24/32 "H 


P(EIN)= 


La anterior sugiere la definición de probabilidad condicional. 


Definición 4.18 (Probabilidad condicional). Sean A y B dos eventos en un espacio muestral M. Si P(B)AH0, 
deénimos la probabilidad condicional del evento A dado el evento B como: 


P(ANB) 

PA) => 
ED $ 

Ejemplo 4.19. En un experimento clásico en genética, Sturtevant determinó el número de entrecruces en tres 

pos de hembra de la mosca Drosophila melanogaster. A continuación se presentan las probabilidades obtenidas. 


"Buente: adaptado de “Classic papers in Genetics”. J. A. Peters, Ed. Prentice Hall Inc., 1962). 


Tipo a hembra | Sin entrecruce | Sin entrecruce Com entrecruce | entrecruce 


0.7710 0.0203 
0.1530 0.0039 
0.0500 0.0018 


0.9740 0.0260 1.0000 


0.7913 


Sean los eventos 


C : Hembra con entrecruce 


E : Hembra sin entrecruce 


La proporción de entrecruces en toda la población es de 0.0260. Para determinar si ésta depende del tipo de 
hembra, calcularemos P(C/H,), P(C/H,) y P(CI1B;3). 
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P(CNH,) _ 0.0203 


P(C/H,)= = =0.0256 
A) P(H) 0.7913 d 
P(CNA,) 0. 
picim, y HEDES) _ 050059 o 949 

P(H,) 0.1569 
P(CNHA 
P(C/H,)= 3) _ 0.0018 _ 0.9347 


P(H,) 0.0518 


En este caso vemos que estas tres probabilidades son aproximadamente iguales a P(C), por lo que la probabilidad 
de entrecruces parece no depender del tipo de hembra. Similarmente, 


P(H,)=0.7913, 
P(H, /C)= Pazos = 0.7808 
P(H,/C*)= 50 =0.7916 
e 


Independencia. En el ejemplo 4.19 vimos que 
P(CIH,), P(CI1H,) y P(C1H5) 


son aproximadamente iguales entre sí y con P(C), es decir que la probabiliddad de entrecruce es aproximadamente 
igual, independientemente del tipo de hembra de que se trate. Con estas ideas en mente se define el concepto 
de independencia. 


Definición 4.19 (Independencia de eventos). Sean A y B dos eventos y sea P(B)%0. A y B son eventos 
independientes si: 


P(AIB)= P(A) 


Como consecuencia de la definición 4.19 tenemos que, si A y B son independientes: 


P(AB) 


Tr di 


P(AIB)= 


por lo que: 


P(ANB)=P(4)P(B) 
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| 
< También, por la definición de probabilidad condicional, 
| 
P(ANB) 


i Pele 


por los resultados anteriores: 


P(AN B) = P(A)P(B) 


por tanto, 


rara 2 DP pep) 
PA) 


lo anterior se resume enseguida. 


4.20. Suponga que un impulso eléctrico debe pasar del punto I al II para producir una señal. Para llegar 

punto II debe pasar por dos componentes electrónicos (E, y E,). La trayectoria del impulso se interrumpe si 

cualquiera de los componentes. La probabilidad de que el componente £, no falle es 0.7 y la probabilidad 

que el componente E, no falle es 0.8. Además, la probabilidad de que al menos uno no falle es 0.94. ¿Cuál 
la probabilidad de que la señal se produzca? 


os los siguientes eventos: 


A : El componente E, no falla 
B : El componente £, no falla 


os entonces, que: 


P(A)=0.7; P(B)=0.8; P(AU B)=0.94 


probabilidad pedida es P(AN B) . Pero, por la regla 1: 


P(AUB)=P(4)+P(B)-P(PNB) 
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por lo que: 


PLAN B)=P(A4)+P(B)-P(AUB)=0.7+0.8-0.94=0.56 


La probabilidad de que se produzca la señal es 0.56. Nótese que, además: 


PLAN B)=0.56=(0.7)(0.8)= P(A)P(B), 


por lo que A y B son eventos independientes. Las otras dos condiciones dadas para la independencia también se 
cumplen, como puede verificarlo fácilmente el lector. 4 
4.7. El teorema de Bayes y las probabilidades subjetivas 


El concepto de probabilidad condicional da lugar a ramificaciones muy discutidas en las inferencias obtenidas 
usando el cálculo de probabilidades. 


Estas dificultades provienen de la aplicación del llamado Teorema de Bayes. Este teorema es una consecuencia 
simple de la definición de probabilidad condicional, puesto que, de acuerdo con ésta: 


PLAN B) 


P(AI B)= P) 


de donde: 


P(ANB)=P(A/B)P(B) 


Pero, también: 


P(ANB) 


MBIA = 


por lo que: 


P(ANB)=P(BIA)P(A) 


y podemos escribir: 


P(A/B)P(B)=P(B/A)P(A) 


o bien: 


P(B/A)PCA) 


P(AIB)= D 
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Para visualizar las dificultades a que nos puede llevar este último resultado, consideremos la siguiente 
simación: una empresa petrolera planea perforar en una zona donde no se tiene la seguridad de que exista 
petróleo. Los técnicos, de acuerdo con su experiencia, creen que la probabilidad de que exista petróleo en la 
zona es 0.1. Se tiene la opción de hacer una prueba preliminar antes de tomar una decisión. La prueba no 
es concluyente, puesto que hay casos en que da resultados erróneos. Si existe petróleo, la prueba es positiva 
20) % de las veces, pero aun si no existe petróleo la prueba es positiva el 20 % de las veces. Simbólicamente, 
senemos los eventos: 


A : Existe petróleo 
A" : No existe petróleo 


B : La prueba es positiva 


De acuerdo con lo anterior, conocemos las siguientes probabilidades: 


P(A)=0.1; P(B/A4)=0.9; P(B/4*)=0.2 


La probabilidad que nos interesa es P(A/ B), es decir, la probabilidad de que exista petróleo dado que la 
prueba resulta positiva. Esta probabilidad se calcula como sigue. De acuerdo con la expresión derivada arriba: 


P(BI A)P(A) 


P(A/B)= P 


En esta expresión la única cantidad desconocida es P(B) , pero puede calcularse fácilmente ya que: 
P(B)=P(BNA)+P(BNA)=P(B/AP(A)+ P(B A) pla) 


como es evidente del diagrama de Venn que se presenta en seguida. 


BAA BNA: 
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se tiene entonces que: 


P(BIA)P(A) 


PA =b- dso i a 
P(BIAP(A)+P(BI A) pla) 


Y usando nuestros datos se obtiene: 


_ (0.9)(0.1) ¿AA 
PAE (0.9)(0.1)+(0.2)(0.9) 27 3 


La conclusión a la que se llega es que, aunque la prueba resulte positiva, la probabilidad de que exista petróleo 


š 1 . « . .» + . 
es muy baja - , aunque mayor que la sostenida “a priori” por los técnicos de la empresa. 
3 


La principal objeción que se hace a este tipo de inferencia, llamada “a posteriori” (puesto que estamos calculando 
la probabilidad de que exista petróleo, dado que la prueba resulta positiva) se basa en la elección de las 
„Je «e . .” . .]. . . . . 
probabilidades “a priori”, que en ocasiones son probabilidades subjetivas. Para dramatizar el efecto que tiene la 
elección de estas probabilidades, supongamos que los técnicos de otra empresa tienen una evaluación distinta 
de P (A); digamos que creen que P (4)=0.4. Con este valor para P (A), si repetimos los cálculos anteriores 

obtenemos: 


P(B)=P(BNA)+P(BNA)=P(BIAP(A)+P(BI A) P(A) 
= (0.9)(0.4)+ (0.2) (0.6) = 0.48 


Por lo que: 


Parga 2AM _09)0.4)_3 
P(B) 0.48 4 


De manera que de acuerdo con la opinión de estos técnicos concluiríamos 
que, si la prueba resulta positiva, la probabilidad de encontrar petróleo 
es alta y quizá nuestra decisión sería diferente. De cualquier manera 

los resultados anteriores (aceptado un valor para las probabilidades “a 
priori”) son inobjetables desde el punto de vista matemático. Con esta 
perspectiva presentamos el teorema del cual los ejemplos anteriores son 
casos particulares. El teorema se conoce como Teorema de Bayes, en 
honor de su descubridor, el matemático inglés Thomas Bayes (1702- 


1761). 


Teorema de Bayes. Sean A, A.. Ap eventos que forman 
una partición de un espacio muestral M. Sea B un 


evento en M. Suponga que P(4,), P(A, Jea PLA, ), 
P(B/4,), P(B1/4,),....P(B/A,) son probabilidades 


conocidas. Entonces: 


nn 


Thomas Bayes 
1702-1761 
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ets PAP... 


$ P(8/4,)P(4) 


=1,2,...,k 


Ejemplo 4.21. El profesor Z tiene tres secretarias con diferentes niveles de competencia. Las secretarias son $}, 
5 y S}. La secretaria S, ha escrito el 20 % de un trabajo, la secretaria S, el 40 % y la secretaria S} el 40 %. Hay 
=a error ortográfico que irrita en especial al profesor, y éste ha calculado que $, lo comete el 90 % de las veces 
ae tiene que escribir la palabra en cuestión, que S, lo comete el 40 % de las veces, y Sz nunca. Si el profesor 
Z encuentra ese error en una página del trabajo, ¿cuál es la probabilidad de que esa página la haya escrito la 
secretaria S}? ¿la secretaria S,? ¿la secretaria S3? 


Tenemos, con notación obvia: 


P(S,)=0.2, P(S,)=0.4, P(S,)=0.4 
P(E/S,)=0.9, P(E/S,)=0.4, P(E/S,)=0 


Entonces: 
_PEISIPS) _ 
ASI === e 12133 

Pero, 

3 

P(E)= Y P(E/S,)P(S,)=(0.9)(0.2)+(0.43(0.4)+(0)(0.4) = 0.34 

j=1 

Por tanto: 


(0.9)(0.2)_18_ 9 


P(S/1/E)=—_==== 
(5112) 0.34 34 17 
P(S,/E)= (0.41(0.4) _16 _ 8 
y 0.34 34 17 
(0)(0.4) 
P(S,/E)= =0 
(S3 1E) 0.34 


Nótese que la información adicional de que el error se ha cometido nos da probabilidades “a posteriori” muy 
diferentes de las probabilidades “a priori”. Así, por ejemplo, la probabilidad a priori de que S, haya escrito la 
página es el doble de la probabilidad de que la haya escrito $}, pero las probabilidades “a posteriori” son casi 
iguales, debido a que S, comete el error con mucho mayor frecuencia que $}. En este caso las probabilidades “a 
priori” son objetivas y no habría objeción al uso del teorema de Bayes. 6 
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Ejercicios 


4.1. Liste los elementos de los siguientes conjuntos: 


a) A = (x[x es un número positivo menor que siete). 


=] 
b= fs}. 

2 
c) C = [x]x es uno de los colores del espectro según Newton). 
d) D = (xx es un número primo menor que 18). 


e) E = {x|x es una de las cuatro estaciones del año). 


4.2 Mediante una regla que describa a sus elementos caracterice sucintamente a los siguiente conjuntos: 


a) A = (x[x enero, febrero, marzo, abril, mayo, junio, julio, agosto, septiembre, octubre, noviembre, 
diciembre). 


b) B = (10, 100, 1000, 10 000, 100 000, 1 000 000,...,}. 
c) C = (vista, olfato, tacto, gusto, oído}. 


d) D = (1, 3, 5,7, 9s}: 
4.3. Sea A= (a,x*,0,8). Encuentre todos los subconjuntos propios de A. 


4.4. Sean A, By C subconjuntos de un conjunto universal U. Si A = (1, 3, 4), B = {1, 3, 6, 9), C = 12, 4, 
5, 7,9, 10) y U = ([1, 2, 3, 4, 5, 6,7, 8, 9, 10), encuentre los siguientes conjuntos: 


a) A dAUBUC g) (AUBY ) lucy 
b) AU B e) BNC h) U* k) (zuc) 
JANB FANBNC AUB n (æ nB) 


4.5. Verifique los resultados del ejercicio 4.4 mediante diagramas de Venn. 


4.6. Sean U ={x|-6 <x <36}; A={x|-6<x<8}; B={x|-3<x<6}; C={x|2<x<18}; 
D ={x|18 < x < 34} . Encuentre: 


nn. 
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a) AUBUCUD d) (ANBYUD 
b) (AdU DY e) ANBNCND. 


o lunpnc) 


4.7. Construya el espacio muestral para cada uno de los siguientes experimentos: 
a) Se pregunta a una persona si la primera letra de su apellido es vocal o consonante. 
b) Se pregunta a cuatro personas si el día del mes en que nacieron es número non o par. 
c) Se examinan 8 plantas y se registra el número de ellas atacadas por cierta enfermedad. 


d) Se escucha una estación de radio y se cuenta el número de segundos transcurridos hasta que se 
escucha la palabra sincategoremático. 


e) Se determina el porcentaje de humedad relativa en un invernadero. 
f) Se pregunta a una pareja el número de años completos de escuela primaria cursados por cada uno. 
g) Se determina el peso específico y la pureza de un metal. 


4.8. En cada uno de los casos del ejercicio 4.7 clasifique al espacio muestral en unidimensional o 
bidimensional y en discreto o continuo. 


4.9. Considere el experimento consistente en preguntar a dos personas si creen 
que Marlowe escribió las obras de Shakespeare. Clasifique la respuesta 
como si (S), no (N) o sin opinión (1). 


a) Escriba el espacio muestral M. 


b) Liste los elementos de M correspondientes al evento A, consistente 
en que una persona o menos lo creen. 


c) Liste los elementos de M correspondientes al evento B, consistente 
en que menos de una persona lo cree. 


A William Shakespeare 
d) Encuentre A U B, A N B, (4UB?. 1564-1616 


e) Encuentre los eventos A, (cero personas lo creen), 4, (una persona lo cree) y Az (dos personas lo 
creen). ¿Forman A;, A) y A; una partición de M? ¿Por qué? 


f) Encuentre eventos que integren una partición de M. 


Md 
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4.10. 


4.11. 


4.12, 


4.13. 


4.14. 


4.15. 


4.16. 


4.17. 


Suponga que B,, B,, B, y B; forman una partición de un espacio muestral M. Si P(B,)=2P(B,), 
P(B,)=4/8 y P(B,)=1/8, encuentre P(B,) y P(B,). 


Suponga (aunque no es cierto) que un individuo paranoico no puede ser esquizofrénico. Si la | 
probabilidad de que alguien sea paranoico es 0.01 y la probabilidad de que sea esquizofrénico es 0.02, 
¿cuál es la probabilidad de que sea esquizofrénico o paranoico? 


Suponga lo siguiente: la probabilidad de que un habitante de la ciudad de México sea mayor de 40 
años o tenga calvicie es 0.4. Si la probabilidad de que sea mayor de 40 años es 0.2 y la probabilidad de 
que tenga calvicie es 0.3, ¿cuál es la probabilidad de que sea mayor de 40 años y calvo? 

En el ejercicio 4.12 defina los siguientes eventos: 

A : Individuo mayor de 40 años. 


B : Individuo con calvicie. 


Calcule las probabilidades de los siguientes eventos y exprese en palabras lo que cada uno significa: 


a) A e) ANB 
b) ANB“ f) (B/4) 
c) (AUB) g) (B14°) 
d) 4NB h) (8°74). 


En el ejercicio 4.13, ¿son independientes los eventos A y B? ¿Por qué? 


En el ejercicio 4.13 (ver incisos c y e) encontramos que el evento (AU B) es igual al evento A N B°. 
Mediante diagramas de Venn muestre que esto es cierto en general. Esta es una de las llamadas “Leyes 
de De Morgan”. 


Muestre que si dos eventos A y B son mutuamente excluyentes no pueden ser independientes (suponga 
que P (4)>0 y P (B)>0). 


Suponga que los eventos A, B y C constituyen una partición de un espacio muestral M. Si 


P(AUB)Y == y P(A)=1/3, calcule P (B) y P (C). 


4.18. 


4.19. 


4.21. 


4.22. 


En el inciso b) del ejercicio 4.7 suponga que la probabilidad de que una persona nazca en día par es 
0.40, y que las fechas de nacimiento de las cuatro personas son independientes. 


a) Calcule la probabilidad de cada uno de los elementos del espacio muestral. 


b) Encuentre la probabilidad de que exactamente dos de los 4 individuos entrevistados hayan nacido 
en fecha non. 
c) Encuentre la probabilidad de que dos o menos de los entrevistados hayan nacido en fecha non. 


d) Encuentre la probabilidad de que más de dos de los entrevistados hayan nacido en fecha par. 


De un estudio realizado en una gran ciudad se tienen los siguientes resultados: la probabilidad de que 
el cónyuge femenino de una pareja apoye a un cierto partido político es 0.3; la probabilidad de que 
el cónyuge masculino lo apoye es 0.4. Además, la probabilidad de que el varón lo apoye dado que la 
mujer lo apoya es 0.6. Con estos datos calcule las probabilidades de los siguientes eventos: 


a) Que la mujer lo apoye dado que el varón lo apoya. 

b) Que ambos lo apoyen. 

c) Que al menos uno lo apoye. 

Suponga que la probabilidad de que un mono, tecleando al azar en 
una máquina de escribir reproduzca un soneto de Sor Juana Inés 
de la Cruz es 0.001. La probabilidad de que un segundo mono 


(¿más inteligente?) lo reproduzca es 0.002. ¿Cuál tendría que ser 
la probabilidad de que al menos uno de ellos lo reproduzca para 


el “trabajo” de los dos monos fuera independiente? Sor Juana Inés de la Cruz 
1651-1695 
En un invernadero se tienen plantas de cuatro variedades distintas (V,, V,, Vz y V4) en las proporciones 


50 %, 20 %, 20 % y 10 %. Sabemos que una cierta enfermedad ataca a 5 % de las plantas de la 
variedad V,, a 10 % de las de V,, al 7.5 % de las de V} y a 30 % de las de V,. Si una cierta planta está 
afectada por la enfermedad, ¿cuál es la probabilidad de que sea de la variedad V,? ¿V,? ¿V3? ¿V¿? 
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5.1. Variable aleatoria 


En el capítulo anterior definimos el concepto de experimento aleatorio y, asociado con él, establecimos el 

acepto de espacio muestral. Usando ambas podemos describir la mayoría de las situaciones en que se 
senducen experimentos con el fin de adquirir información sobre algún aspecto del mundo que nos rodea, 
Una vez especificado el espacio muestral, tenemos una descripción exhaustiva de todos los resultados posibles 
del experimento. En ocasiones, sin embargo, el espacio muestral no es una forma suficientemente breve de 
describir los resultados que nos interesan. Para ejemplificar, recordemos el experimento descrito en el capítulo 
£ consistente en aplicar insecticida a tres larvas de un insecto y, al cabo de cierto tiempo, observar los insectos 


JS (v) y muertos (m). En este caso el espacio muestral es: 


M = {vwv, MVV, VMV, VUM, VMM, MUVM, MMV, mmm} 


supóngase que sólo estamos interesados en el número de insectos muertos. Entonces los resultados pueden 
representarse por los números 0, 1, 2 y 3. Si consideramos esos números como valores tomados por una variable 

entonces esa variable toma valores de acuerdo con los resultados de un experimento aleatorio, y podemos 
sensar en X como en una variable aleatoria, que en este caso representa el número de insectos muertos de un 
sotal de tres. En este experimento X toma el valor cero si ocurre el evento {vvv}; el valor uno si ocurre cualquiera 
de los tres eventos {mvv}, {vmv}, o [vum); el valor 2 si ocurre cualquiera de los eventos {vmm}, {mvm} o {vum}; 

el valor 3 si ocurre el evento {mmm}. En general, una variable aleatoria tomará un valor definido para cada 


sesultado posible de un experimento. Una variable aleatoria es, entonces, una función que a cada elemento de 
sn espacio muestral le asocia un número real. Si a los ocho puntos ordenados del espacio M en el experimento 
de los insectos los representamos por B,, B,,..., Bg, tenemos que la variable aleatoria X, aplicada a cada punto del 


espacio muestral que es su dominio, nos da: 


-i 
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X(B,) X (Bs) 
X(B,)=1 X(B¿)=2 
x(B)=1 X(B,) 
X(B,)=1 X(B;)=2 


Gráficamente se tiene: 


De acuerdo con la discusión anterior presentamos la siguiente definición: 


Definición 5.1 (Variable aleatoria). Una variable aleatoria es una función que a cada resultado posible de un 
experimento aleatorio le asocia un número real. Es decir, es una función definida sobre un espacio muestral. € 


Clasificación de variables aleatorias. Cuando se abordó el tema de espacios muestrales, se clasificaron éstos en 
discretos y continuos. Una clasificación similar puede hacerse para variables aleatorias. Diremos que una variable 
aleatoria es discreta si puede tomar cuando más un número infinito denumerable de valores, y que es continua 
si puede tomar cualquier valor en un intervalo dado. 


5.2. Distribuciones de variables aleatorias 


En el espacio muestral presentado en la sección anterior los eventos (B,) a [B¿) forman una partición de M. 
Supóngase que a estos eventos les asociamos las siguientes probabilidades: 


P(B) =P} 


7 


P(B) =P=) 
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% cada evento del espacio le hemos asociado un número, que es el valor que toma una variable denotada por X. 
5 por ejemplo, con el evento [B, | se asocia el valor cero, de tal forma que X toma el valor cero con la misma 


probabilidad asignada a [B, } ; escribimos entonces: 


P(X =0)= P(([B,) =1/32 
P(X =1)= P({B,}U{B;}U{B;})= P({B,})+ P({B;})+ P({8,}) 
e N i 
32 32 32 32 
Px=2)=P((8,)U(8JU18,))=P((8,))+ 2 ((8,))+2((8,)) 
e TN = 
32 32 50 2 
P(X =3)=P(18,))=7/32 


Los resultados anteriores pueden resumirse en una tabla como la siguiente: 


Tabla 5.1. Distribución de probabilidades para el número de insectos muertos. 


Valor de X AE EA NR 
Probabilidad de X 15/32 


La Tabla 5.1 proporciona la distribución de probabilidades para la variable aleatoria X, definida sobre la partición 
1B.).....(B,) en el espacio muestral M. El hecho de que la información del experimento pueda resumirse al 
æasiderar únicamente los valores de X nos conduce a la noción de función de probabilidades de una variable 
aleatoria. Debido a que existen diferencias importantes en la presentación del concepto cuando la variable 
aleatoria es discreta y cuando es continua, nos referiremos por separado a estos dos casos. 


Función de probabilidades de una variable aleatoria discreta 


Una variable aleatoria discreta es aquella que puede tomar cuando más un número infinito denumerable de 
walores. En la inmensa mayoría de las situaciones prácticas, las variables aleatorias discretas representan conteos 
de alguna característica, por lo que en ocasiones sus distribuciones (probabilidades de tomar valores específicos) 
seciben el nombre de distribuciones de conteos. 


¡Cuando el número de valores que puede tomar la variable aleatoria es grande, resulta impráctico presentar todos 
los valores posibles en una tabla, y es más conveniente describir su comportamiento probabilístico mediante 
uma ecuación. Adoptaremos la convención de denotar por X a una variable aleatoria, y por x a los valores que puede 
ssar; de modo que si tenemos una ecuación que genera las probabilidades correspondientes a dichos valores, 
escribiremos: 


fx (x)=P(X =x) 


Por ejemplo, para x = 2, 
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Con estas ideas en mente formulamos la siguiente definición: 


Definición 5.2 (Función de probabilidades). La función de probabilidades de una variable aleatoria discreta X es 
el conjunto de pares ordenados Lx, fy (x)= P(X = x)), donde x es cada uno de los valores que puede tomar 
la variable aleatoria X, y fy (x) la probabilidad asociada con el valor particular x. 6 


Puesto que en el caso de una variable aleatoria discreta los valores posibles de X tienen correspondencia con una 
partición del espacio muestral, es claro que deben cumplirse las siguientes propiedades para fy (x): 


a) fy (x)>0 para todo valor de x de X 


b) È fx ()=1, 


donde la suma es para todos los valores x que puede tomar la variable aleatoria X. 


Estas propiedades son congruentes con la idea de probabilidad como frecuencia relativa estabilizada, como se 
ilustra en el siguiente ejemplo: 


Ejemplo 5.1. En una gran ciudad se pregunta a 10 000 personas el número de horas (completas) que ven 
televisión diariamente. Para este experimento definimos la variable aleatoria X como el número de horas que 
cada persona ve televisión. Los resultados obtenidos son: 


Número de horas 2 $ 4 5 6 ya 8 9 
Personas ( F) 2000 | 3000 | 2500 | 700 400 200 180 10 


Si aceptamos que las frecuencias relativas se han estabilizado para 10 000 repeticiones del experimento, 
podemos tomar las frecuencias relativas como probabilidades, y con ellas construir una tabla para la función de 


probabilidades de X. 


0 1 2 3 4 5 6 7 8 9 3 
0.001 0.100 0.200 0.300 0.250 0.070 0.040 0.020 0.018 0.001 | 1.000 
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el ejemplo siguiente las probabilidades se obtienen directamente de evaluar una función, la cual se ha definido 
itrariamente, pero cuidando de satisfacer las propiedades (5.1) y (5.2). 


iplo 5.2. Considérese una variable aleatoria X con la siguiente función de probabilidades: 


2 
P(X =x)= fy(x)= Sa x=1,2,3,4,5 


evaluamos la función para todos los valores de X obtenemos la siguiente tabla: 


x 1 2 3 4 5 2 
fe) | 3/35 5/35 7/35 9/35 11/35 | 35/35 


f fx (x) 20, para x =1,2,3,4,5 


laramente: 


5 2x+1 sj 
395 


5 
È fx (x)= 


x=] x=l 


+ 


Representación gráfica de funciones de probabilidad 


“Tal como lo hicimos para las tablas de frecuencias en el capítulo 2, a menudo es conveniente representar 
gráficamente las funciones de probabilidad. Las dos formas más usadas para la representación gráfica de estas 
Esnciones son diagramas de puntos e histogramas de probabilidades. Estos dos tipos de gráfica fueron discutidos 
sn amplitud en el capítulo 2, por lo que en esta sección únicamente se ilustrará su uso en funciones de 


probabilidad mediante un ejemplo. 


alo 5.3. Sea X una variable aleatoria con la siguiente función de probabilidades: 
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2 
1.0 
El diagrama de puntos correspondiente se presenta enseguida. 
f X (x ) 

0.3 

0.2 

0.1 

= =l 0 2 3 4 


Figura 5.1. Diagrama de puntos para una función de probabilidades. 


La representación gráfica de la función mediante un histograma es la siguiente: 


fix) 


=2 =d 0 1 2 3 4 


Figura 5.2. Histograma de probabilidades. ® 
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La forma más común de construir un histograma de probabilidades es erigir rectángulos de base unitaria, 
cuyo centro es cada uno de los valores que puede tomar la variable aleatoria X, y cuya altura es fx (x), o 
sea, la probabilidad de que X tome el valor particular x. Construidos en esta forma, los rectángulos tienen la 
propiedad de que el área de uno cualquiera de ellos es igual a la probabilidad fx (x) para el valor en cuestión, y 
el área total del histograma es uno. Esta asociación de las probabilidades con áreas es esencial para presentar las 
distribuciones de variables aleatorias de tipo continuo. 


Funciones de densidad de probabilidades para variables aleatorias continuas 


Nuestro siguiente problema es caracterizar la distribución de probabilidades de una variable aleatoria continua. 
La primera dificultad que enfrentamos es que no podemos construir una tabla con los valores posibles de 
la variable, puesto que el número de valores que puede tomar es infinito. De modo que la única forma que 
senemos de caracterizar la distribución de probabilidades es mediante una ecuación. Antes de establecer 
formalmente las propiedades que debe poseer la función que la represente, es conveniente recordar nuestra 
correspondencia entre frecuencia relativa y probabilidad, y extender esta correspondencia a los histogramas y 
tablas de frecuencias estudiadas en el capítulo 2. La distribución de probabilidades de una variable aleatoria 
puede visualizarse gráficamente como una “forma límite” del histograma de frecuencias relativas. El sentido 
en que usamos la expresión “forma límite” será claro si presentamos un ejemplo con datos reales. Para obtener 
los datos del ejemplo realizamos el experimento aleatorio consistente en seleccionar discos fonográficos de una 
discoteca y registrar la duración de las pistas en que están divididas las caras de los discos. Inicialmente se obtuvo 
una muestra de 50 pistas, y con los resultados se construyeron el histograma y la tabla de frecuencias relativas 
que se presentan a continuación: 


Tabla 5.2. Tabla de frecuencias para la duración de 50 pistas de discos (en minutos). 


Intervalo Frecuencia Frecuencia relativa 
(1,2 7 0.14 
(2,3] 27 0.54 
(3,4] 14 0.28 
(4,5) 1 0.02 
(5,6] 1 0.02 
2 50 1.00 


El histograma correspondiente se presenta en la Figura 5.3. 


En el histograma presentado en la Figura 5.3 se cumplen las propiedades establecidas para un histograma en 
el capítulo 2; es decir, que el área total de los rectángulos es uno, y también que el área de un rectángulo es la 
frecuencia relativa de la clase que tiene como base. Así, la frecuencia relativa en el intervalo (2,3] es 0.54, lo que 
equivale a decir que 54 % de las pistas examinadas tienen una duración mayor de 2 y menor o igual que tres 


minutos. 


Sin embargo, dado este histograma es imposible decir cuál es la frecuencia relativa entre 2.5 y 3 minutos 
o entre 2 y 2.5 minutos. Si se intenta hacer un histograma con anchuras de clase más pequeñas, la figura 
resultante presenta una forma más irregular que la de la Figura 5.3. Para refinar la presentación se tomó una 
muestra adicional de 200 pistas. Las 250 observaciones se resumen en seguida en una tabla de frecuencias y un 
histograma de frecuencias relativas. 
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2 3 4 
Duración de las pistas 


Figura 5.3. Histograma y polígono de frecuencias relativas para la duración de 50 pistas 


de disco con intervalos de clase de un minuto. 


Tabla 5.3. Tabla de frecuencias para la duración de 250 pistas de discos (en minutos). 


Intervalo Frecuencia Frecuencia relativa 
(1.0,1.5] 6 0.024 
(1.5,2.0] 18 0.072 
(2.0,2.5] 53 0.212 
(2.5,3.0] 62 0.248 
(3.0,3.5] 45 0.180 
(3.5,4.0] 32 0.128 
(4.0,4.5] 16 0.064 
(4.5,5.0] 8 0.032 
(5.0,5.5] 4 0.016 
(5.5,6.0] 3 0.012 
(6.0,6.5] 3 0.012 
Ss 250 1.000 


Estudiando el histograma que se presenta en la Figura 5.4 podemos dar respuesta a algunas preguntas que no es 
posible contestar a partir de la Figura 5.3. Por ejemplo, la frecuencia relativa de las pistas con duración de entre 2 
y 2.5 minutos es 0.212. Puede observarse también que el polígono de frecuencias construido sobre el histograma 
tiene ángulos más “suaves” que el construído en la Figura 5.3. Si continuáramos incrementando el número de 
observaciones podríamos disminuir simultáneamente la anchura de los intervalos. Aunque este proceso no puede 
continuar indefinidamente, debido a que la precisión de nuestras mediciones es limitada, conceptualmente 
podemos imaginar un proceso infinito de refinamiento de nuestros histogramas hasta que el polígono de frecuencias 
construido sobre los rectángulos tome la forma de la función continua graficada en la Figura 5.5. Puesto que hemos 
interpretado la probabilidad como la forma estabilizada de la frecuencia relativa, la “forma límite” de la Figura 5.5, 
representa la distribución de probabilidades de la característica X en estudio; de manera que el área bajo fy (x) en 
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es 1, y el área delimitada por fy (x) y dos líneas verticales levantadas sobre los puntos a y b (a < 5) es la 
idad de que la variable aleatoria X tome un valor entre a y b. 


Pi 


ll 15 2 25 9 33 € y % % 6 
Duración de las pistas 


Figura 5.4. Histograma y polígono de frecuencias relativas para la duración de 250 pistas 


de discos con intervalos de 0.5 minutos. 


estas ideas procedemos a establecer las propiedades que debe cumplir una función para ser una función de 


de probabilidades. 


que estas propiedades son congruentes con (y además sugeridas por) la relación que hemos establecido 

frecuencia relativa y probabilidad, de manera que los histogramas y tablas de frecuencias del capítulo 2 son 
Y q g y 

imaciones a las distribuciones teóricas discutidas aquí. 


diferencia fundamental entre las distribuciones de variables aleatorias discretas y continuas es que, en el 
de las discretas, la probabilidad total se encuentra distribuida en un número finito o infinito denumerable 
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de puntos. Como consecuencia, si la variable puede tomar un valor $, puede asignarse un valor a P(X = $), 
la condición de que la suma de probabilidades para todos los puntos sea 1. Si se trata de una variable aleato 
continua, ésta puede tomar cualquier valor en un intervalo dado, y si se asigna una probabilidad, por pequ 
que sea, a cada uno de estos valores, la probabilidad total no sumará 1. Esto nos lleva a concluir que, para 
variable continua, la probabilidad asociada con un punto cualquiera es cero. Es decir, P(X =k) = 0 para 


cualquier valor que tome la variable. Consecuentemente si X es continua, fx (1) 4% P(X =x). 


fix) 


a 
~} 


Figura 5.5. Función de densidad de probabilidades. 


A primera vista la afirmación anterior puede parecer desconcertante, puesto que podría interpretarse, en el 
ejemplo de las pistas de discos discutido previamente, como si ninguna pista pudiera tener una duración de, 
digamos, 1.8 minutos, ya que afirmamos que P(X =1.8)=0. En realidad debemos interpretar la aseveración 
diciendo que, dada la precisión de nuestros instrumentos de medición, no podemos distinguir entre las pistas 
con duración de 1.8 minutos y las que tienen duración de 1.8001 o 1.7999 minutos, y en lo que estamos 
interesados es en la probabilidad del intervalo (1.7999, 1.8001]. Por otra parte, puesto que las probabilidades 
son áreas bajo la curva, sólo es posible calcular probabilidades (áreas) correspondientes a intervalos dado que, 
por definición, el área de una línea (que correspondería a la probabilidad de un punto) es cero. 


Ejemplo 5.4. La variable aleatoria cuya función de densidad de probabilidades se presenta en la gráfica 5.6 recibe 
el nombre de Uniforme, y será estudiada con detalle en el capítulo 6. 


a 
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f(x) 


Figura 5.6. Distribución uniforme en el intervalo [0,1]. 


Su ecuación es: 
| fi (x)= | 


110<x<l 


0, de otra forma 


Las funciones de densidad serán presentadas siempre en dos partes, como se ejemplifica arriba. En la primera 
| sæ especifican los puntos para los cuales la función de densidad tiene un valor positivo y en la segunda todos los 
demás valores, para los cuales la función toma el valor cero. 


= Amque en general es necesario evaluar una integral para calcular probabilidades en una variable aleatoria 
continua, en este caso el problema se simplifica, puesto que la probabilidad de un intervalo cualquiera [a, b] es 
el área de un rectángulo con base hb — a y altura 1. Así, podemos calcular: 


1 2 
b) p(x s3)=r[05x<3)-30=> 
3 E” 


9 n5<x<1)=[5)0=5 
3 3 3 
d) P(0.2< X <0.8)=(0.6)(1) =0.6 
e) P(X>0.4)=P(0.4< X <1)=(0.6)(1)=0.6 
fP(X>D=0 


g) P(X<0)=0 
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En este caso, el hecho de que una línea tenga área cero nos conduce a la siguiente igualdad: 


rxs3)=o[x< 3) 
3 3) 3 


ya que: 


El siguiente ejemplo nos permite ilustrar diferencias entre variables aleatorias discretas y continuas. 


Ejemplo 5.5. Suponga que una variedad de maíz puede producir plantas con cero, una, dos y tres mazorcas. Se 
sabe además que las probabilidades de que se tengan plantas con esos números de mazorcas son 0.1, 0.7, 0.1 y 
0.1. Haciendo una tabla se tiene: 


x 0 1 2 3 2 
fix) 0.1 0.7 0.1 0.1 1.0 


Con esta función de probabilidades: 


P(X <1)= P(X =0)+P(X =1)= fy (0)+ fy (1) 
=0.1+0.7 =0.8 


En cambio: 


P(X<D=P(X=0)= fy (0)=0.1 


Es claro entonces que: 


P(X <1)# P(X <1) 


ya que la variable aleatoria discreta del ejemplo tiene una masa probabilística de 0.7 concentrada en el punto 
X=1.90 


En el ejemplo 5.4 pudimos calcular probabilidades de intervalos utilizando propiedades geométricas conocidas 
del rectángulo delimitado por fx (x) y el eje de las abscisas. En general, el cálculo de probabilidades en 
distribuciones continuas requiere de conocimientos de cálculo integral que están más allá del nivel matemático 
supuesto en los lectores de este libro, por lo que en los capítulos subsiguientes sólo utilizaremos variables 
aleatorias continuas para las que existen tablas (que se proporcionan al final de este libro) con áreas calculadas 
para los intervalos más frecuentemente usados. 


DITA 


5.3. La función de distribución acumulativa de probabilidades 


Es el capítulo 2 no sólo se trabajó con frecuencias relativas, sino también con frecuencias relativas acumuladas. 


Smilarmente, podemos definir la función de distribución acumulativa de probabilidades de una variable aleatoria. 


Definición 5.3 (Función de distribución acumulativa de probabilidades). La función de distribución acumulativa 
de probabilidades de una variable aleatoria X (discreta o continua) se denotará por Fy (x), y se define como: 


Fy (x)=P(X <x) e 


Es daro que, en el caso de una variable aleatoria discreta, el valor de Fy (x) para un valor dado x de la variable 

Ts obtendrá sumando los valores fy (x) para todos los valores posibles de X menores o iguales que x, y en el 
X p P 8 q y 

aso de una variable continua, realizando la integración de fy (x) para esos valores. 


Ejemplo 5.6. Utilizando la distribución uniforme presentada en el ejemplo 5.4 ilustramos el cálculo de Fy (x) 
para una variable aleatoria continua. La función de densidad de probabilidades es: 


1¡0<x<l 


fx o=] 


0, de otra forma 


De la gráfica siguiente es fácil apreciar que, para cualquier valor x menor o igual que cero Fy (x)= 0; para 
ssalquier valor x mayor que cero y menor que uno, Fy (x)= x, ya que es el área de un rectángulo de base x 
y altura l; y para un valor x mayor o igual que 1, Fy (x)= 1. Esto último se comprende si consideramos que 
X sólo tiene probabilidad positiva en el intervalo [0, 1] y, por tanto, Fy (x)= P(X <x)=1 para todo valor 
x 21. Similarmente se interpreta el hecho de que Fy (x)= 0 para toda x < 0, puesto que X no puede tomar 
walores menores que cero. 


KO po 


Figura 5.7. Cálculo de la función de distribución acumulativa de probabilidades. 
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La función de distribución acumulativa es, entonces, en este ejemplo: 


0x<0 
Fx(x)=4x30<x<1 


Liz, 


Su gráfica se presenta en la Figura 5.8. 


Fy (x) 


1/2 porron i 


0 1/2 1 


Figura 5.8. Función de distribución acumulativa de probabilidades de la distribución uniforme [0, 1]. 


En el siguiente ejemplo se ilustra el cálculo de Fy (x) en una variable aleatoria discreta. 


Ejemplo 5.7. La variable aleatoria discreta presentada en el ejemplo 5.5 tiene la siguiente distribución de 


probabilidades: 


La función de distribución acumulativa se calcula enseguida: 


0; x<0 
0k U=wsi 
Fx (x)=40.8; 1£x<2 
09 231<3 
1.0) 23 
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comprender este cálculo, considérese la evaluación de Fy (x) en cualquier punto en el intervalo [1, 2). Para 
T= 1 tenemos Fy (1)= P(X <1)= fy (0)+ fy (1) =0.1+0.7 =0.8. Ahora considérese el valor X =1.5, 
el cual se tiene Fy (1.5) = P(X <1.5)= fy (0)+ fy (1) =0.8, y se obtendrá el mismo valor de 0.8 para 
uier x en el intervalo [1, 2), ya que la variable no puede tomar ningún valor mayor que uno y menor que 

ss. Esto es muy claro en nuestro ejemplo, ya que la probabilidad de que una planta de maíz tenga 1.5 o menos 
rcas es igual a la probabilidad de que tenga una o menos mazorcas. El hecho de que la variable aleatoria sea 

y, por consiguiente, tenga masa probabilística concentrada en puntos aislados se refleja en los “saltos” 


le la función de distribución acumulativa. La función escalón de esta variable es típica de las variables aleatorias 
(ver Figura 5.9). 6 


a seguida se anotarán las propiedades que poseen las funciones de distribución acumulativa de probabilidades. 
lector debe verificar que estas propiedades se cumplen en los ejemplos 5.6 y 5.7. 


Fy (x) 


0.4 


0.2 


Figura 5.9. Función de distribución acumulativa de una variable aleatoria discreta. 
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5.4. Las distribuciones de variables aleatorias como modelos para representar 
situaciones reales 


En la sección 5.2, especialmente al hablar de variables aleatorias continuas, hemos hecho hincapié en la relación 
entre las frecuencias relativas e histogramas del capítulo 2 y las funciones de distribución de probabilidades. Para 
generar la idea de una función de densidad de probabilidades recurrimos al expediente de tomar un número 
cada vez mayor de observaciones y construir histogramas cada vez más refinados por lo que toca a la anchura 
de los intervalos. En lo que sigue nos referiremos a las tablas e histogramas generados con base en una muestra 
como distribuciones empíricas, y a las funciones de probabilidad y funciones de densidad de probabilidades como 
distribuciones teóricas. Por regla general, en la práctica se tienen distribuciones empíricas para las cuales, basados 
en nuestra experiencia o en la de otros investigadores, proponemos distribuciones teóricas que sirvan de modelo 
para el fenómeno bajo estudio. En particular, como se mencionó páginas atrás, ciertas distribuciones teóricas que 
serán estudiadas en el capítulo 6 han probado ser modelos adecuados para una gran variedad de situaciones reales. 


Desde un punto de vista eminentemente pragmático, es difícil que un fenómeno sea representado con exactitud 
por una distribución teórica, pero eso no invalida a las distribuciones teóricas como modelos para situaciones 
reales. Dado el grado de aproximación con que trabajan las ciencias experimentales, es suficiente que el modelo 
teórico no difiera apreciablemente de la situación que se desea describir para que éste sea útil. 


5.5. Momentos de variables aleatorias: Esperanza y Varianza 


En las secciones 5.2, 5.3 y 5.4 se ha introducido la idea de usar distribuciones teóricas como modelos para las 
distribuciones empíricas generadas a partir de los datos recolectados al estudiar un fenómeno. Se han estudiado 
también representaciones gráficas de estas distribuciones teóricas. Similarmente a lo expuesto en las distribuciones 
empíricas, es conveniente disponer de medidas que describan de manera sucinta los aspectos más sobresalientes 
de las distribuciones teóricas. Estas medidas reciben el nombre genérico de Momentos de la distribución, y los 
más importantes son los correspondientes a la media y la varianza de las distribuciones empíricas definidas 
en el capítulo 3. Los momentos de una distribución teórica son de dos tipos: Momentos respecto a la media y 
Momentos con respecto al origen. Para mantener un nivel matemático elemental en la presentación, sólo se dan las 
definiciones y propiedades para variables aleatorias discretas. Los lectores con una formación matemática más 
avanzada no tendrán dificultad en extender las propiedades al caso de variables aleatorias continuas, sustituyendo 
la sumatoria por el símbolo de integral en los lugares apropiados. 


Definición 5.4 (r-ésimo momento al origen). Sea X una variable aleatoria discreta 
con función de probabilidades fy (x), y sea r un entero positivo. El »-ésimo 
momento al origen se denota por EX” ), y tiene por ecuación: 


E(x )=5 x fy (x) 


Donde la sumatoria se efectúa para todos los valores posibles de la variable 
aleatoria X. ® 


Esperanza matemática 


, , , , f Christiaan Huyghens 
En la definición 5.4 es de particular importancia el caso r = 1. Entonces se tiene: 1629-1695 


Capítulo 5 
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES. MOMENTOS 


E(X)=Y x fy (x) 
s (5.3) 


En este caso nos referimos a E(X) como la Media o Esperanza Matemática de la distribución teórica, y la 
denotamos por la letra griega 4. Su relación con la media aritmética de la distribución empírica es evidente si 
consideramos la ecuación de cálculo para la media aritmética en una tabla de frecuencias. Si se tienen % clases 
con valores medios de clase v}, 1,,..., Vp y frecuencias relativas p}, p>.» Pp la media aritmética tiene como 
ecuación: 


dis (5.4) 


Comparando (5.3) con (5.4), vemos que en (5.4) las v; son observaciones de la variable aleatoria X, y las p; son 
las frecuencias relativas de las clases, mientras que en (5.3) tenemos los valores posibles de Xy sus probabilidades 
respectivas. De esta manera ¥ puede considerarse como el homólogo de u en la distribución empírica. Esta 
relación es muy importante, y se explorará en detalle en capítulos posteriores. 


Ejemplo 5.8. Sea X una variable aleatoria discreta con la siguiente función de probabilidades. 


En este caso la esperanza de X es: 
E(X) = uy = (-3)(0.1)+(-2)(0.2) +(—1)(0.4) 
+(0)(0.2)+(1)(0.1)=—1.0 


y el segundo momento al origen es: 


Elx?) =(-3)(0.1)+(-2)(0.2)+(-1* (0.4) 


+(0)*(0.2)+(1)* (0.1) = 2.2 m 


Fisicamente, la esperanza matemática tiene una interpretación interesante, la cual se ilustra en la Figura 5.10, 


para la función de probabilidades del ejemplo 5.8. Si imaginamos que cada rectángulo del histograma es un 
Bloque con igual base, y formamos con los bloques una figura tridimensional, la esperanza matemática es el 


punto de equilibrio de la figura. 
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fix) 


0.4 


0.3 


0.2 


0.1 


Mx =-1 


Figura 5.10. La esperanza de X(u y) es el punto de equilibrio del histograma. 


Esta última propiedad refuerza la idea de correspondencia establecida entre la media aritmética y la esperanza 
matemática, pues sugiere la utilización de E(X) como una medida del “centro” de la distribución teórica. 


El uso genérico del término momentos requiere una explicación. El nombre se ha tomado prestado de la Física, 
donde denota el producto de una fuerza aplicada en un punto por una distancia llamada “brazo de palanca”. En 
el caso de los momentos de una distribución, la fuerza sería la probabilidad en un punto (fẹ (x)), y el “brazo de 
palanca” sería x”. Esto se ilustra, en la Figura 5.11, para la esperanza matemática. 


fix) 


fx x) 


| 


Figura 5.11. Interpretación física de la esperanza matemática. E(X) = D ACIR 
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Mótese que en el caso de los momentos con respecto al origen el “brazo de palanca” es la distancia del punto al 
aigen. Con esta idea es fácil comprender el cálculo de momentos con respecto a la media. 


Definición 5.5 (r-ésimo momento con respecto a la media). Sea X una variable aleatoria discreta con función de 
probabilidades fy (x) y media uy. Sea r un entero positivo cualquiera. El »-ésimo momento con respecto a la 
media se denota por E(X — Uy Y y tiene por ecuación; 


E(X -ugy = 2 (+11) fx). 


Donde la sumatoria se efectúa sobre todos los valores posibles de la variable aleatoria X. 6 


Varianza poblacional. Entre los momentos con respecto a la media tiene especial importancia el segundo, el cual 
secibe el nombre de Varianza. Si r=2 se tiene, en la definición 5.5: 


E(X—uyY =Var(X)= X(x- uy y Fela) 
E (5.5) 


Asi como fue posible establecer una relación entre la esperanza matemática y la media aritmética, puede hacerse 
ma correspondencia entre Var(X), interpretada como una medida de dispersión en la distribución teórica, 
y * , la varianza muestral calculada en una tabla de frecuencias. Para diferenciarla de Ses la varianza de la 
distribución teórica se representará por 0%. 


Para obtener una medida de la dispersión de la distribución teórica en las unidades originales de medición 
definimos la desviación estándar (Ø y ) como la raíz cuadrada positiva de 0%. Es decir: 


Es = Jo} = War% = JE(X-uxř = Zle-try fx (x) (5.6) 


Ejemplo 5.9. Se calculará la varianza para la variable aleatoria X del ejemplo 5.8. Para ello es útil construir la 


tbla siguiente. 


Tabla 5.4. Cálculo de la varianza de una variable aleatoria. 


(x— uy) fi (x) 


(xy Xx 


o% =1.20 


(x-y y fx (x) 
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La tabla precedente nos permite calcular directamente algunos momentos, tanto con respecto a la media come 
con respecto al origen. La suma de la tercera hilera nos da: 


x=» fy (x)=-1.0 


En la quinta hilera hemos calculado el primer momento con respecto a la media. La suma de esa hilera es: 
E(X—ux)= (Mx) fx ()=0 


Este resultado, E(X—uy)=0, es general para cualquier distribución, y será establecido formalmente más 
adelante. 


Finalmente, la última hilera de la tabla 5.4 nos permite calcular el valor de la varianza de X. Por la definición | 
de 0%: 


e = (+11) fx (x)=1.20 


De donde se obtiene inmediatamente el valor de la desviación estándar: 
O y = 1.20 =1.0954 + 


Ejemplo 5.10. Como un segundo ejemplo calcularemos la esperanza matemática y varianza de la variable 
aleatoria X, cuya función de probabilidades es: 


X = 1,2,3,4,5 
fx (x)= 


0, de otra forma 


La esperanza de X es: 


ponle) jode pole 


La varianza de X se calcula enseguida: 


0% =X x=.) fi (0) = ar: Jue- JE | 
+(3-3) - Jus JE ]}+6- 3y - )- 2.0 


La desviación estándar es: 
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Oy =1.414 + 


dades de la esperanza matemática 


propiedades que se anotan en seguida son muy útiles en el manejo del concepto de esperanza matemática: 


propiedades pueden verificarse para una variable aleatoria discreta aplicando la definición de esperanza 
semática y las propiedades de la sumatoria estudiadas en el capítulo 2. El lector que haya estudiado el 
dice 3-B encontrará fácilmente la relación entre estas propiedades y las de la media aritmética para variables 
formadas. En el ejemplo 5.11 se presentan aplicaciones de estas propiedades. 


alo 5.11. Sea X una variable aleatoria con la siguiente función de probabilidades. 


aronces, la esperanza matemática de X es: 


uy =1(0.4)+2(0.3)+3(0.2) + 4(0.1) = 2.0 


əóngase ahora que se desea calcular la esperanza de la variable aleatoria Y = 2X. Una forma de hacerlo es 
la función de probabilidades de Y. Claramente Y toma los valores 2, 4, 6 y 8 para los mismos eventos 
d espacio muestral para los que X toma los valores 1, 2, 3 y 4. Por tanto, la función de probabilidad de Yes: 


De donde la esperanza de Y es: 
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E(Y) = 2(0.4)+4(0.3)+6(0.2)+8(0.1) = 4.0 


Alternativamente, usando la propiedad (5.8) obtenemos: 


E(Y)=EQX)=2E(X)=2(02)=40 


Supóngase ahora que es necesario calcular la esperanza de la variable aleatoria Z = X —3. La función 


probabilidades de Z es: 
z =2 =1 0 bo 
f7(z) 04 03 02 l 1.0 


E(Z) =(-2)(0.4) +(- 1)(0.3) +(0)(0.2)+(1)(0.1) =-1.0 


Usando la tabla se obtiene: 


El mismo resultado puede obtenerse usando la propiedad (5.9), ya que haciendo & =—3 tenemos: 


E(Z)=E(X-3)= E(X)+(-3)=2-3=-1.0 


Finalmente, para verificar la propiedad (5.10) considérese la variable aleatoria W =4+06X. La función de 


probabilidades de Wes: 
w 10 16 22 28 $ 
fyw) 0.4 0.3 0.2 0.1 1.0 


E(W) = (10)(0.4)+(16)(0.3) + (22)(0.2) + (28)(0.1)= 16.0 


Por tanto: 


Este resultado es inmediato usando la propiedad (5.10), tomando c, = 4 y c, = 6, puesto que, entonces: 


E(W)=4+6E£(X)=4+6(2)=16 


Estas aplicaciones nos dan una idea de la utilidad de las propiedades (5.7) a (5.10) cuando se trata de calcular la 
esperanza matemática de funciones de una variable aleatoria. 4 


En el ejemplo 5.9 se mencionó que el primer momento con respecto a la media es siempre cero. Es decir que, 
para cualquier variable aleatoria X, 


-m 
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E(X-Hy)=0 


Tando la propiedad (5.9) esta aseveración es fácil de verificar. Se recomienda al lector que compare esta 
»piedad con la establecida para la suma de las desviaciones con respecto a la media aritmética en el capítulo 3. 


Propiedades de la varianza 


continuación se presentan algunas propiedades que resultan útiles en el cálculo de la varianza de ciertas 
ciones de variables aleatorias. Estas propiedades son consecuencia de las que se establecieron antes para la 
ranza matemática. 


La propiedad (5.11) es una consecuencia directa de la definición de varianza, ya que X(x- lx F fy (x) es 
sa suma de cantidades no negativas. En cuanto a (5.12), es fácil de verificar, puesto que: 


Var(c)= Ele- E (F = Ele- c? = (0% = E(0)=0 


E resto de las propiedades son igualmente sencillas de probar, y se dejan como ejercicio al lector, aunque se 
“Bastran en el ejemplo 5.12. 


i plo 5.12. La variable aleatoria X del ejemplo 5.11 tiene la función de probabilidades siguiente: 


| 
| 
| 
| 
| 


En este caso = 2.0. De donde, usando la definición de varianza, obtenemos: 
| X 

E 
j 


| Var(X)=0% = Y (x—uy Y fx (x) = (1-2)? (0.4) 


+(2—2)*(0.3)+(3—2)(0.2)+(4-2)*(0.1)=1.0 
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Para verificar la propiedad (5.15) es suficiente calcular E(X?). Usando la definición 5.4: 
Elx?) =(1)*(0.4)+(2) (0.3) +(3)* (0.2) +(4)?(0.1)=5.0 
Entonces, por (5.15): 
Var(X)=El(x?)-u?, =5-4=1.0 


como se había obtenido antes. En general, esta forma de calcular la varianza es más conveniente que la de la 
ecuación (5.5), ya que nos ahorra el cálculo de las desviaciones. Se sugiere al lector comparar la ecuación (5.15) 
con la forma alternativa para el cálculo de la varianza en el capítulo 3. 


X 
Para ilustrar la propiedad (5.13), supóngase que se desea calcular la varianza de Y = EN En este caso tómese 


1 
c= > y aplíquese la propiedad mencionada. Entonces: 


Var) =Var| 3) =Z var 00 =309=7 
3 9 9 9 


Para verificar este cálculo, primero obtenemos la función de probabilidades de Y, la cual es: 


y 13 2⁄3 313 4/3 
fela) 0.4 0.3 0.2 0.1 


Para esta variable: 


METR E TE 
2 2 2 2 
(12)=(3) ; (2 0. (2) 0.2 $) E E. 
E 3 (0.4) + 3 (0.3) + 3 (0.2) + 3 (0.1) J 


De donde, usando (5.15), se obtiene: 


2 2 4 1 
Var(Y)= E(y?)- (u; Y =- 53 


Finalmente, para ilustrar la propiedad (5.14), sea Z = —2 + X. Es decir, en (5.14) tomamos ¢ =—2, Entonces, 
de acuerdo con la ecuación que quiere verificarse: 


Var(Z)=0}, =Var(-2+ X)=Var(X)=1.0 
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Alsernativamente, la función de probabilidades de Z es: 


u> =(=1)(0.4) +(0)(0.3)+(1)(0.2) + (2)(0.1)= 0 
E(Zz?)=(-1)} (0.4) + (0)? (0.3) + (1) (0.2) + (2) (0.1) =1.0 


Var(Z)= E(Z?)-[E(2)} =1.0-0=1.0 y 


Mediana y moda de una distribución teórica 
Tal como se hizo en el capítulo 3, al proponer medidas descriptivas para las distribuciones empíricas, se 
propondrán en seguida otras dos medidas de tendencia central para distribuciones teóricas. Nos referimos a la 


Boda y la Mediana de la distribución de una variable aleatoria. 


Definición 5.6 (Mediana de una distribución teórica). Sea Xuna variable aleatoria. La mediana de la distribución 
de probabilidades de X es un valor Me tal que: 


1 
P(X <Me)25 


1 
P(X2Me)25 


Dicho en palabras: Me es un valor tal que la probabilidad acumulada hasta (e incluyendo a) Me es al menos 


> y la probabilidad desde (e incluyendo Me) es al menos > 4 


De 
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Los siguientes ejemplos ilustran el hecho de que la mediana de una distribución teórica no es necesariamente 
un valor único. 


Ejemplo 5.13. Sea X una variable aleatoria con función de probabilidades: 


En este caso la mediana Me = 3 es única, puesto que: 


P(X <3)=0.7 y P(X 23)=0.7 


y no existe otro valor de X que satisfaga la definición 5.6. 4 


Ejemplo 5.14. En el caso de la variable aleatoria X cuya distribución se presenta en seguida, la mediana no es única: 


En este ejemplo: 


P(X<3)=0.5 y P(X >3)=0.8 


Pero, también, 


P(X<4)=0.7 y P(X >4)=0.5 


De modo que los valores X = 3 y X= 4 satisfacen ambos la definición de mediana. + 

Definición 5.7 (Moda de una distribución teórica). La moda de la distribución de una variable aleatoria X es 
el valor Mo para el cual fy (x) toma el valor máximo. En el caso de una variable aleatoria discreta, esto es 
equivalente a decir que Mo es el valor de X con mayor probabilidad. 4 


Como se verá enseguida, tampoco la moda es necesariamente un valor único. 


Ejemplo 5.15. Sea X una variable aleatoria con función de probabilidades: 


s Fi 
fx(x)= 15 


0, de otra forma 


sx =-—2,—1,0,1,2 
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Exaluando esta función se obtiene: 


ts e ts e 


De tal forma que tanto —2 como 2 son modas de la distribución. 6 


Ejemplo 5.16. Sea X una variable aleatoria con función de probabilidades: 


áx—=x? +2 
fx(x)= 18 


0, de otra forma 


;% = 0,1,2,3 


La función en forma de tabla es: 


6 
Dado que el valor fy (2)= q” el mayor de todos, tenemos que la moda (única) de la distribución es 2. 4 


Los ejemplos 5.13 a 5.16 ilustran algunas propiedades de la moda y la mediana. En el ejemplo 5.13 tenemos 
que la media, moda y mediana tienen el mismo valor de 3. Esto se debe a que la distribución es simétrica, 
y la moda y la mediana tienen valores únicos. En el ejemplo 5.14 es fácil verificar que la media es 3.6, 
la moda 3 y la mediana cualquier valor entre (e incluyendo a) 3 y 4. En este caso la distribución tiene 
una ligera asimetría hacia la derecha. En el ejemplo 5.15, la media y la mediana tienen el mismo valor 
My, =MelX)=0 por ser simétrica la distribución, pero la moda no coincide con ellas por no ser un 
yalor único. Finalmente, en el ejemplo 5.16, la media tiene un valor de 1.77, la mediana de 2 y la moda 
también de 2. En este caso la distribución tiene una ligera asimetría hacia la izquierda. El lector puede 
verificar que las posiciones relativas de las tres medidas coinciden con los postulados para sus homólogos en 
distribuciones empíricas. 
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5.7. Distribución conjunta de dos variables aleatorias 


En esta sección continuamos nuestra analogía con los capítulos 2 y 3, donde se consideró el caso de una 
investigación en la cual se estudian simultáneamente dos características y se obtuvieron tablas de frecuencias de 
doble entrada. En el capítulo 4, al discutir espacios muestrales, se consideraron dos características, generando 
espacios muestrales bidimensionales. Es natural, entonces, ocuparnos ahora de la distribución teórica conjunta 
de dos variables aleatorias. Indistintamente nos referiremos a esta distribución como la distribución conjunta de 
dos variables aleatorias o como la distribución de una variable aleatoria bidimensional. Para mantener accesible 
el nivel matemático de la discusión, restringiremos nuestro estudio a las variables aleatorias bidimensionales 
de tipo discreto. Continuando nuestro paralelismo con las tablas de frecuencias, consideremos dos variables 
aleatorias discretas X y Y, que pueden tomar los siguientes valores: 


Xt 


Y: Jis J2 Jm 


Podemos entonces construir una tabla de doble entrada de dimensiones 2 Xm, donde el valor pij en el cruce de 
la ż i-ésima hilera con la j-ésima columna es la frecuencia relativa del evento: “X toma el valor x; ma el valor 
Jj - Si imaginamos un experimento para el cual las frecuencias relativas se han estabilizado, podemos pensar 
en p; como en la probabilidad de ese evento. Si denotamos por fx y (x, y 5) la probabilidad mencionada, 
tenemos: 


Íxy (x,y¡)=P(X=x;; Y = y;) 


Nos referiremos a fy y (2%, y 4) como la probabilidad conjunta de que X y Y tomen los valores x; Y 
respectivamente. La tabla que lista todos los valores posibles de X y todos los valores posibles de Y, junto con las 
probabilidades correspondientes, es la distribución de probabilidades conjunta de X y Y. Alternativamente, las 
probabilidades de cada celda pueden ser generadas de una ecuación, como en el caso de las variables aleatorias 
unidimensionales. La forma de tabla se presenta en seguida. 


Tabla 5.5. Distribución conjunta de probabilidades de X y Y. 


Fun) flen) z F (xi Im) 
Fun) fn) 0. S (2, Jm) 


Fx) Fr Y2) ... Fr Im) 


A continuación se presenta un ejemplo para afirmar los conceptos esbozados en los párrafos precedentes. Con 
objeto de que el ejemplo tenga características que permitan ilustrar los puntos más importantes, se ha realizado 
un experimento que quizá sea de poco interés práctico, pero que sirve bien para nuestros propósitos. 
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Ejemplo 5.17. Para generar la distribución teórica de una variable aleatoria bidimensional realizamos el siguiente 
experimento: de una gran cantidad de revistas elegimos 1000 páginas, y en cada página una línea. En cada línea 
sentamos el número de veces que aparece la letra r y el número de veces que aparece la letra g. Sea la variable 
dleatoria X el número de veces que aparece la letra ren cada línea, y sea Yel número de veces que aparece la letra 
g Si consideramos que las frecuencias relativas se han estabilizado para 1000 repeticiones del experimento, los 
datos de la tabla siguiente nos dan la distribución conjunta de probabilidades de X y Y. 


A 


Desde un punto de vista práctico, el hecho de que en la celda X = 3, Y = 0, aparezca el número 0.18 quiere 
decir que, de las 1000 líneas examinadas, en 180 encontramos 3 veces la letra r y cero veces la letra g; pero si 
aceptamos esta distribución como la teórica, entonces, de acuerdo con la notación previa, 


fx y (3,0) = P(X =3,Y =0)= P (tres r y cero g)=0.18 


Similarmente: 


fxy (4,1) =P(X = 4,Y =1) = P (cuatro r y una g) = 0.07 
fxy (19)=P(X=1 Y =3)= P (una r y tres g) = 0.01, 


encétera. ®© 


Ea el ejemplo 5.18 se presenta la distribución teórica de una variable aleatoria bidimensional mediante una 
ecuación. 


Ejemplo 5.18. Considérese la siguiente función de probabilidades conjunta: 


x + 


£ 

—=; x=0,1,2; y=0,1,2 

Fxy (oy)=3 18 j ? 
0, de otra forma 


A partir de la ecuación es posible obtener todos los valores de la función para los cuales está definida. En seguida 
se muestra el cálculo de algunos de estos valores. 
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0+0 
Fx.y (0,0) = P(X=0,Y =0)==32=0 
0+2 2 
0,2 =P ASQ Y [=2 = — = — 
fxv (0,2) ( ) TERT 
2+1 3 
2,1 =p Xar si = — =-— 
fxr, ) ( ) 18 T 


la tabla de doble entrada que muestra las probabilidades para todos los valores posibles de X y Y se presen: 
abajo. 


5 
0/18 1/18 3/18 
1/18 2/18 3/18 6/18 


2/18 3/18 
2 3/18 6/18 9/18 18/18 æ% 


De los dos ejemplos anteriores, pero sobre todo de la correspondencia establecida entre funciones de distribución 
conjunta y tablas de doble entrada de frecuencias relativas, se desprenden las siguientes propiedades para la 
distribución de probabilidades de una variable aleatoria bidimensional. 


Ejemplo 5.19. Verificaremos (5.16) y (5.17) en la tabla del ejemplo 5.18. La primera ecuación es obvio que se 
cumple. Por lo que toca a la segunda se tiene: 


EÈ fx, y = L0.0)+£00,)+ £00,2)+ f(1,0)+ fa) 
i j d 


+D SLOH SONIFODS AA 


18 18 
1 2 
II 3 E T" 
18 18 18 18 18 18 18 + 
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buciones marginales de X y Y 


como se señaló en las tablas de frecuencias de doble entrada, a partir de ellas pueden obtenerse las frecuencias 
iduales de cada una de las dos características en cuestión. En las distribuciones teóricas puede procederse 
igual manera. En la tabla del ejemplo 5.17 se observa que el evento para el cual X = 1 ocurre con los eventos 
los cuales Y = 0, Y = 1, Y = 2 y Y = 3. De los principios probabilísticos presentados en el capítulo 4 es 
entonces que: 


PX =D = fy Q) = P(X =1,Y =0)+ P(X =1,Y =1) 
+P(X =1,Y =2)+ P(X =1,Y =3)=0.01+0.02 
+0.00 +0.01 = 0.04 


Similarmente puede verificarse que P(X =2) = fy (2), se obtiene sumando la segunda hilera de la tabla, y 
ene el valor de 0.14. Si se desea obtener probabilidades para Y, basta sumar las columnas de la tabla de doble 
entrada. Así, P(Y =0)= f,(0)=0.61, P(Y =1)= f,(1)=0.21, etc. El hecho de que las probabilidades 
pæra X sean las sumas en el margen derecho de la tabla de doble entrada, y las probabilidades para Y sean las 
mas en el margen inferior de la misma, sugiere el nombre de funciones marginales de probabilidad para las 
Esnciones de probabilidad resultantes. 

De estas ideas surge la siguiente definición. 


Definición 5.8 (Funciones marginales de probabilidad). Sean X y Y dos variables aleatorias, y sea fy y (x,, y 5) 
s función de probabilidades conjunta. 


La función marginal de probabilidades de X es: 


Fx (x,)= È fxy (xy) 


donde la suma es para todos los valores y; que puede tomar la variable aleatoria Y. 


La función marginal de probabilidades de Y es: 
fr (»,)= Dir (xoy) 
donde la suma es para todos los valores x; que puede tomar la variable aleatoria X. 6 


Ejemplo 5.20. La función conjunta de probabilidades de Xy Y en el ejemplo 5.18 es: 


P 
— y=0,1,2 y=0,1,2 
fxy (o y)=3 18 


0, de otra forma 


De aquí que la función marginal de X sea: 
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xt+y_x+0 x+1l x+2 x+l 


H_—— = —— 
18 18 18 18 16 


fx (x)= Y fxy (x, y)= b3 


O sea: 


——; x = 0,1,2 


0, de otra forma 
Evaluando la función se obtiene: 


fx w= D= f (2)=- 


La distribución marginal de Y es: 


sty Oty, Itty 2+y_ y+l 
n y). TEE LI ALLA 
fr (y) È xy ())= 2 18 18 18 18 6 


Es decir: 
y+l 
350,142 
fr (y)= 6 
0, de otra forma 
Por lo que: 
1 2 3 
(00)=-; 4 0)=4; f (2)=> 
Oig 


El lector puede verificar que estas probabilidades ya estaban calculadas como las sumas de hileras y columnas de 
la tabla en el ejemplo 5.18. 6 


En el ejemplo anterior las distribuciones de X y Y son idénticas. Éste no es un resultado general, y se debe a una 
casualidad que haya ocurrido en el ejemplo anterior. 


Distribución de una función de X y Y 


A menudo es necesario conocer la distribución de probabilidades de una función de las variables aleatorias X y Y. 
Por ejemplo, en una investigación sobre el ingreso familiar, donde X representa el ingreso del cónyuge masculino 
y Y el del cónyuge femenino en una pareja, es de gran interés estudiar la función de probabilidades de X + Y, o 
sea el ingreso total por pareja. En el caso de variables aleatorias discretas, sobre todo cuando cada variable sólo 
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puede tomar unos cuantos valores, la función de probabilidades de una función de ambas es fácil de calcular. En 
seguida se presenta un ejemplo ilustrativo. 


Ejemplo 5.21. En una comunidad rural se realizó una investigación sobre escolaridad en parejas formando un 
múdleo familiar. Se midió la escolaridad de cada individuo mediante una variable aleatoria discreta que puede 
smar los siguientes valores: 


: El individuo no asistió a la escuela 

: El individuo no completó la primaria 

: El individuo tiene primaria completa 

: El individuo tiene secundaria completa 

: El individuo tiene preparatoria completa 
: El individuo tiene estudios profesionales 


MH nh O 


Si la variable aleatoria X representa la escolaridad del cónyuge femenino y la variable aleatoria Y la del cónyuge 
smasculino, se tiene la función de probabilidades conjunta que se presenta en la siguiente tabla. 


0.06 0.25 0.25 0.22 0.15 0.07 1.00 


Se W = X + Y la escolaridad total de la pareja. La variable aleatoria W puede tomar los valores 0, 1, 2, 3,..., 10. 
Obsérvese que W puede tomar el valor cero sólo si X = 0 y Y = 0 y, por tanto: 


Fw (0)=P(W =0)= fy y (0,0) =0.04 
Ahora, W toma el valor 1 si X= 0 y Y= 1,osi X= 1 y Y= 0, por lo que 
fy V=P(W=1D= fy y (0,1) + fy y (1,0) =0.03+0.01= 0.04 


Similarmente: 


fu O)=P(W =2)= fu y (0,2)+ Fe y (1,1)+ fy y (2,0) 
=0.03+0.10+0.01=0.14 
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De manera análoga pueden calcularse las demás probabilidades. La tabla con la función de probabilidades de W 


se presenta enseguida. 


8 9 10 bs 
0.10 0.08 0.00 0.01 1.0 


Aditividad de la Esperanza Matemática 


Una propiedad muy utilizada de la esperanza matemática es la de aditividad. Con lo anterior queremos decir 
que si se tienen dos variables aleatorias X y Y, y se quiere obtener la esperanza de la variable aleatoria X + Y, 
entonces: 


E(X+Y)=E(X)+E(Y) 
E(X-—Y)=E(X)-E(Y) (5.18) 


De manera más general tenemos el siguiente resultado: 


Ejemplo 5.22. En el ejemplo 5.21 se calculó la función de probabilidades de la suma de dos variables aleatorias. 
Ahora se usará la variable aleatoria resultante para ejemplificar la aplicación del resultado (5.18). Primero 
obtenemos Æ (W) directamente de la definición de esperanza matemática: 


E(W) =0(0.04)+1(0.04)+2(0.14)+3(0.19)+4(0.18)+5(0.15) 
+6(0.07)+7(0.10) +8(0.08) +9(0.00)+10(0.01) = 4.22 


Enseguida, usando las distribuciones marginales de Xy Y: 


E(X) =0(0.10)+1(0.25)+2(0.40)+ 3(0.20) 
+4(0.04)+5(0.01)=1.86 


E(Y) =0(0.06)+1(0.25)+2(0.25) + 3(0.22) 
+4(0.15)+5(0.07) = 2.36 


De tal forma que, utilizando (5.18): 


-i 
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E(W)=E(X)+ E(Y)=1.86+2.36 = 4.22 


¡Con lo cual hemos ilustrado la aditividad de la esperanza matemática. 


5.8. Momentos conjuntos de variables aleatorias. Correlación 


¡Con el propósito de describir algunos aspectos del comportamiento conjunto de dos variables, especialmente 
d grado de asociación entre ellas, definiremos el concepto de momento conjunto de dos variables aleatorias. Al 
igual que en el caso de variables unidimensionales, se tienen momentos con 
respecto al origen y momentos con respecto a la media. 


Definición 5.9 (Momentos conjuntos con respecto al origen). Sean X y Y 

dos variables aleatorias discretas, y sea fy y (x, y) su función conjunta de 
) Xy >; J 

probabilidades. El £-/-ésimo momento conjunto con respecto al origen es: 


Elx*y!)= Ši DA (y ) 
i j 


Donde la suma es sobre todos los valores que pueden tomar X y Y. 4 


El caso más importante de momento conjunto con respecto al origen es Karl Pearson 
cuando k = 1 y /= 1. Tenemos, entonces: Creador del concepto de correlación 
i 1857-1936 


E(XY)= NI ter (x;,9;) (5.20) 


i 
Este momento recibe el nombre de esperanza conjunta de X y Y. 


Ejemplo 5.23. En el ejemplo 5.21 presentamos la distribución conjunta de X y Y, donde estas variables 
representan respectivamente la escolaridad de los cónyuges femenino y masculino en parejas. Reproducimos la 
tabla de probabilidades. Puesto que tanto X como Y pueden tomar 6 valores cada una, la suma para el cálculo 
de E(XY) es sobre las 36 celdas resultantes, como se muestra a continuación. 


2 
0 0.04 0.03 0.03 0.00 0.00 0.00 0.10 
1 0.01 0.10 0.10 0.04 0.00 0.00 0.25 
2 0.01 0.09 0.11 0.14 0.04 0.01 0.40 
3 0.00 0.03 0.01 0.03 0.08 0.05 0.20 
4 0.00 0.00 0.00 0.01 0.03 0.00 0.04 
5 0.00 0.00 0.00 0.00 0.00 0.01 0.01 
X 0.06 0.25 0.25 0.22 0.15 0.07 1.00 
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E(XY)=(0X0)(0.04)+(0X1)(0.03)+(0X2)(0.03) 
+(0X3)(0.00)+(0X4)(0.00)+(0X5)(0.00) 
+(1Xx0)(0.01)+(1Xx1)(0.10)+(1X2)(0.10) 
+(1 X 3)(0.04) + (1 X 4)(0.00)+(1X5)(0.00) 
+(2 x0)(0.01)+(2Xx1)(0.09) +(2x2)(0.11) 
+(2 X 3)(0.14) + (2 X 4)(0.04) + (2 x 5)(0.01) 
+(3 X 0)(0.00) + (3 X 1)(0.03) + (3 x 2)(0.01) 
+(3 X 3)(0.03) + (3 X 4) (0.08) + (3 X 5)(0.05) 
+(4 X 0)(0.00)+(4X1)(0.00) + (4 x 2) (0.00) 
+(4 X 3)(0.01) + (4 X 4)(0.03) + (4 x 5)(0.00) 
+(5 x 0)(0.00) + (5 X 1)(0.00) + (5 x 2) (0.00) 
+(5 X 3)(0.00) + (5 X 4) (0.00) + (5 xX 5)(0.01) 
=5.28 + 


Definición 5.10 (Momentos conjuntos con respecto a la media). Sean X y Y dos variables aleatorias discretas 
con medias Hy y U y, respectivamente, y cuya función de probabilidades conjunta es fx y (x,y). El k-Lésimo 
momento con respecto a la media se define como: 


EN(X—ux)' (1-1) j= E 3d -ux Ú (y; — uy) xy (x; y;) 


donde la suma es sobre todos los valores que pueden tomar Xy Y. 


Por lo que toca a momentos conjuntos con respecto a la media, el más importante es el primero, es decir, 
cuando k = 1 y / = 1. Este momento recibe el nombre de Covarianza. La ecuación para la covarianza, la cual 


se denotará Cov(X,Y ) es: 


Co(X,Y)=E((X—ux (Y — uy) = (400) 41) fir (žy) 
ij (5.21) 


Ejemplo 5.24. De nuevo nos referiremos a los datos del ejemplo 5.21. Usando la ecuación anterior en esta 
distribución de probabilidades, obtendremos la covarianza entre X y Y. En el ejemplo 5.22 calculamos 
uy =1.86 y Uy = 2.36. Con esos resultados. 


Cov( X,Y )= (0—1.86)(0 — 2.36) (0.04) + (0 — 1.86)(1 — 2.36) (0.03) 
+(0 —1.86)(2 — 2.36) (0.03) + (0 — 1.86)(3 — 2.36) (0.00) 
+(0 — 1.86)(4 — 2.36) (0.00) + (0 — 1.86)(5 — 2.36) (0.00) 
+(1—1.86)(0 — 2.36)(0.01)+ (1— 1.86)(1 — 2.36)(0.10) 
+(1—1.86)(2 —2.36)(0.10) +... 
+(5—1.86)(3—2.36)(0.00)+(5—1.86)(4—2.36)(0.00) 
+(5—1.86)(5—2.36)(0.01) = 0.8904 m 


recomienda al lector que compare la ecuación 5.21 con la ecuación para la covarianza de distribuciones 
mpíricas presentada en el capítulo 3. Los mismos argumentos usados en ese caso para justificar a la covarianza 
ə medida de asociación entre X y Y se aplican a la distribución teórica que estudiamos ahora. 


el ejemplo 5.24 se calculó O yy usando la ecuación (5.21). El proceso de cálculo es, para decir lo menos, 
oso. A continuación se deriva una ecuación alternativa para la obtención de O yy . Obsérvese primero que: 


(X—uy) (Y —1y)=XY -Xy -uxY + Ux My 


O yy = E[(X— uy (Y -uy )}= E(XY -uy X— Uy Y + UxUly) 


E usando la aditividad de la esperanza matemática establecida en la ecuación (5.19): 


+4 My = E(XY)-Ux My 


plo 5.25. Calcularemos Ø yy para la escolaridad en parejas discutida en los ejemplos 5.21 a 5.24, utilizando 
ecuación alternativa (5.22). Antes obtuvimos: 


Uy =1.86; uy =1.86; E(XY)=5.28 


Je donde: 


0 xy = E(XY)- u y ly = 5.28 — (1.86)(2.36) = 0.8904 


que es el valor obtenido, con un cálculo más largo, en el ejemplo 5.24. 4 
lación entre dos variables aleatorias 


igual que en las distribuciones empíricas, al calcular la covarianza entre dos variables aleatorias se tiene la 
desventaja de que el valor resultante depende de las unidades de medición. Así, en el ejemplo de la escolaridad 
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en parejas, podríamos haber usado 0, 10, 20,..., etc., como medida de los grados de escolaridad. En ese caso 
hubiera obtenido un valor diferente para O yy. Con objeto de obtener una medida de asociación que no tenga 
este defecto definiremos, como homólogo de la correlación en distribuciones empíricas, la correlación entre 
variables aleatorias X y Y. 


Definición 5.11. (Correlación en distribuciones teóricas). Sean X y Y dos variables aleatorias. Sean Ø yy, O 

y xY»“x 
y Oy la covarianza entre ellas y las desviaciones estándar respectivas. La correlación entre X y Y se denota por 
O yy, y tiene por expresión: 


Cov[X,Y) O xy 


LP var Ova) 0% "07 e 


Ejemplo 5.26. Continuando con el problema discutido en los ejemplos 5.21 a 5.25, calcularemos la correlación 
entre el grado de escolaridad de los miembros de parejas. Anteriormente se ha obtenido: 


Ux =1.86; Uy = 2.36; O yy = 0.8904 


De las distribuciones marginales (ejemplo 5.23) es fácil obtener: 


gy =1.0804 y 07 =1.8104 
Usando estos datos en la definición 5.11: 


a IU apo 
Px = F oso4vi.8104 . 


La correlación, medida de asociación entre dos variables, tiene algunas propiedades que se anotarán en el 
siguiente recuadro. En el caso recién discutido, la correlación tiene un valor positivo porque existe una 
tendencia natural entre las personas a formar pareja con otras de nivel de educación similar; es decir, que 
valores grandes de X se asocian con valores grandes de Y. De allí el valor positivo de P xy. Un valor negativo 
de p se obtendría, por ejemplo, si X representara el número de faltas de ortografía cometidas por una persona 
y Y su grado de escolaridad. 
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La varianza de una suma de variables aleatorias 


los capítulos subsiguientes será frecuente el problema de encontrar la varianza de una suma de variables 
rias. Para obviar este problema presentamos los siguientes resultados. Sean X y Y dos variables aleatorias y 
Mx, My, O% y 0% las medias y varianzas respectivas. Si la covarianza entre ellas es Ø yy, se tiene: 


Probaremos 5.23. La prueba de 5.24 es similar. 


Sea W = X + Y. De acuerdo con la definición de varianza: 


Var (W)= E[W -EWF = EX +Y)- E(X +F 
= E[{X-EX)} +(Y-EN)] = F{X-E(X)F 
| +E{Y-EY)Y +2E[(X - EGOHY - EM] 
=Var(X)+Var(Y)+2Cov(X,Y ), 


“Lo cual se deseaba demostrar. 
| 
| 

Ejemplo 5.27. En el ejemplo 5.21 se obtuvo la función de probabilidades de W= X + Y, donde Xy Y representan 
la escolaridad de los cónyuges femenino y masculino en parejas. La función de probabilidades de W se reduce 


|en seguida: 


8 9 10 © 
0.10 0.08 0.00 0.01 1.0 


En ejemplos anteriores se obtuvo: 
Var(X) =1.0804; Var (Y ) =1.8104; Cov( X,Y ) = 0.8904 
De donde, de acuerdo con (5.23): 


Var(X +Y )=Var(W)=1.0804 +1.8104 + 2(0.8904) = 4.6716 
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Calculando la varianza de W directamente tenemos: 


Elw?)=0(0.04)+1(0.04)+4(0.14)+9(0.19)+16(0.18) 
+25(0.15)+36(0.07)+49(0.10) + 64(0.08) +81(0.00) 
+100(0.01) = 22.48 


y, del ejemplo 5.22, 


E(W) = 4.22 


por lo cual: 


Var(X +Y)=Var(W)=22.48-(4.22)? = 4.6716 


valor idéntico al obtenido usando a expresión (5.23). 4 


Los resultados (5.23) y (5.24) pueden generalizarse a cualquier número de variables aleatorias. Por ejemplo, para 
tres variables X, Y y Z tendríamos: 


5.9. Independencia de variables aleatorias 


Es de importancia especial el caso en que dos variables aleatorias son independientes. En el capítulo 4 se definió 
la independencia entre dos eventos diciendo que A y B son eventos independientes si y sólo si: 


PAN B)=P(A4)-P(B) 


En el caso de variables aleatorias la definición de independencia es como sigue. 
Definición 5.12 (Independencia de variables aleatorias). Sean X y Y dos variables aleatorias, y sean fy y (x, y), 


FG) y fr (y) su función conjunta de probabilidades y sus funciones marginales, respectivamente. X y Y son 
variables aleatorias independientes si y sólo si: 


Fey (X.Y) = fy CO: fy (Y) 


para todos los valores posibles de X y Y. Si la función se da en una tabla de doble entrada, esta definición es 
equivalente a decir que la probabilidad en cualquier celda es igual al producto de las probabilidades marginales 
correspondientes. ® 


pa 
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Ejemplo 5.28. En el ejemplo 5.18 se estudió la función de probabilidades conjunta: 


STI 
Tig * x=0,1,2; y=0,1,2 


Fxy (x, y)= 


0, de otra forma 


Las distribuciones marginales (ver ejemplo 5.20) son: 


fil)=3 6 po 


0, de otra forma 


+1 
FE y=0,1,2 


f (y)= 


0, de otra forma 


Estas dos variables aleatorias no son independientes puesto que: 


fxy (0) y, (x): fy (y) 


Este resultado también puede verificarse en la tabla de probabilidades conjuntas de X y Y, según se muestra 


enseguida 


0/18 1/18 2/18 
1/18 2/18 3/18 
2/18 3/18 4/18 


Y 3/18 6/18 9/18 18/18 


Nótese que fyy(0,0)=0% fy (0): f,(0)= == 


El lector debe notar que, aunque 


3 


l 6 1 
iTA ET TT T 
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las variables aleatorias no son independientes porque esto no se cumple para X = 0 y Y = 0. Es decir, basta que 
uno de los valores de las celdas no sea igual al producto de las marginales para que las variables aleatorias no sean 


independientes. 6 
En el siguiente ejemplo se presentan dos variables aleatorias independientes. 
Ejemplo 5.29. Sean X y Y dos variables aleatorias con función de probabilidades conjunta: 


TH —3 
fxy (y)= 54 


0, de otra forma 


¿x=1,2; y=2,3,4 


Las funciones de probabilidad marginales son: 


4 rt A 2 OS 


fx(x) = 2 


jua 54 54 

3x=x+9-3 4x—x+12-3 x+3 

AO AS aT l 
54 54 9 

z 2 IRF JLF 

fi (y) E “O 

2 2 

AAA ES 
54 3 


Entonces: 


fer (y 22 kais )= Fx 60 fr (1), 


por lo que las variables aleatorias son independientes. En forma de tabla la función conjunta es: 


NOREEN 
1 4/54 8/54 12/54 
2 5/54 10/54 15/54 


5 9/54 18/54 27/54 54/54 


Se recomienda al lector verificar que las probabilidades en cada una de las celdas son iguales al producto de las 


marginales. 4 
La varianza de una suma de variables aleatorias independientes 


Una de las consecuencias importantes de la independencia de variables aleatorias tiene que ver con su efecto 
sobre la covarianza. Esto se debe a que si dos variables son independientes, el primer momento conjunto es igual 
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oducto de los primeros momentos de las variables en las distribuciones marginales. Es decir que, si X y Y son 
«pendientes: 


E(XY)=E(X)-ElY) 


o es fácil de demostrar ya que: 


E(xY)= DI (x;y;) 
a 
lero si Xy Y son independientes, fy y (x, y)= fy (x); fy (y), por lo que: 


EQ) = 2 D xy fxr (x 1,)= DI tx (x) fr (1) 
El J 


i 


=D xfx (5) Dt (y,)= EX) EY) 
i j 


resultado tiene como consecuencia que si X y Y son independientes, entonces Cov( X,Y )=0. Esto es 
amediato, puesto que: 


Oyy = E(XY)-E(X):ElY) 


o si Xy Y son independientes, entonces E (XY) = E(X)-E(Y) 


Us ado 5.26 podemos modificar las ecuaciones 5.23 y 5.24 para el caso de variables aleatorias independientes 


no sigue: 


Es necesario dejar firmemente establecido el siguiente hecho: mientras que es cierto que para dos variables 
sarorias independientes la covarianza es cero, también es cierto que dos variables pueden tener covarianza cero 
án ser independientes. Esto se ejemplifica en seguida. 


plo 5.30. Sean X y Y dos variables aleatorias con la siguiente distribución conjunta: 


a 
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1/3 


2/3 


3/3 


Obsérvese primero que 


1 
Ley 2-D=04 fD E 


por lo que las variables no son independientes. Sin embargo, 
ECXY)=(-2)-D(0) +(-2(0)(1 / 3) +(-2)()(0) 


0n(5)+oox+ma(>)=o 
1 2 
E(X) =a(5)+0[2)=0 
E(Y) =0(5)+0/)+0[2)=0 
E 3 3 3) 
De donde: 


Cov[X,Y)= E(XY)-E(X):E(Y)=0-—(0)(0)=0 + 


La independencia entre variables aleatorias puede definirse para cualquier número de ellas. En seguida sólo se 
anotará un resultado importante cuando se tienen variables aleatorias independientes. 


En algunas secciones de este capítulo, especialmente en las que se relacionan con momentos de variables aleatorias, 
limitamos la discusión al caso de variables aleatorias discretas. Esto se hizo con el exclusivo propósito de mantener 
la presentación a un nivel accesible para lectores con una preparación matemática elemental. Sin embargo, debe 
notarse que todos los resultados presentados son válidos también para variables aleatorias continuas, siempre que 
se utilice la notación adecuada. En algunas definiciones que sólo se aplican (en la forma presentada) a variables 
aleatorias discretas, se hizo la aclaración explícitamente en el texto de la definición; aquí hacemos la observación 
de que, con ligeras modificaciones, existen definiciones similares para variables continuas. 


a 
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Ejercicios 


5.1. Considere el experimento consistente en elegir cédulas del censo de población mexicano de 1970 y 
determinar si el individuo censado únicamente habla alguna lengua indígena, si sólo habla español, o si 
habla alguna lengua indígena y además español. En el primer caso denote el resultado del experimento 
por J (sólo lengua indígena), en el segundo por £ (sólo español), y en el tercero por B (bilingüe). 


a) Escriba el espacio muestral si se eligen dos cédulas (notar que hay 9 resultados posibles). 


b) Sobre el espacio muestral obtenido defina la variable aleatoria X como el número de individuos 
bilingües. Determine el valor de X para cada uno de los 9 resultados posibles. 


c) De acuerdo con el censo de 1970, P(1)=0.02, P(E)=0.92 y P(B)=0.06 (ésas son las 
frecuencias relativas obtenidas). ¿Cuál es la función de probabilidades para la variable aleatoria X 
definida en (b)? Suponga independencia entre las dos repeticiones del experimento; es decir, que la 
probabilidad del evento {Z7} es 0.0004. 


5.2. En el espacio muestral del experimento descrito en el ejercicio 5.1 (inciso 4) defina la variable aleatoria 
Y como el número de individuos que únicamente hablan una lengua indígena. Obtenga la función de 
probabilidades de Y. Encuentre también la función de probabilidades de Z, el número de individuos 
que sólo hablan español. 


5.3. Dos equipos A y B (elija su deporte preferido) van a disputar un trofeo que se adjudicará el primero de 
ellos que gane 3 encuentros. Considere los encuentros de la serie como repeticiones de un experimento. 

En cada repetición sólo hay dos resultados posibles: gana A o gana B. Por ejemplo, si el equipo A gana 

los primeros tres encuentros, la serie termina, y el evento lo denotamos por 1444). 

a) Escriba el espacio muestral (pista: hay 20 resultados posibles). 

b) De acuerdo con la historia de encuentros entre los equipos A y B, A ha ganado el 60% de sus juegos 
con B. Suponga entonces que P(4)=0.6, y suponga además que los encuentros de la serie son 
independientes. Determine las probabilidades para cada uno de los 20 resultados posibles. 

c) Sea X el número de juegos ganados por el equipo 4. Obtenga la función de probabilidades de X. 

d) Sea Y el número de juegos ganados por el equipo B. Obtenga la función de probabilidades de Y. 

e) Sea Z el número total de encuentros. Obtenga la función de probabilidades de Z. 

5.4. En seguida se presentan cuatro funciones. Determine cuáles son funciones de probabilidades. 


Establezca la razón o razones para su decisión. 


x—1 
2 


a) fylx)= -:=0,1,2 


mn 
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b) fy (x)= x- x? +0.01; x =0.1,0.2,0.3,0.4,0.5 


c) fy (x) = +Vx; x = 0.01,0.04,0.09,0.16 


d) fe ()=7:x=1,23 


> 


5.5. Considere la siguiente función de probabilidades: 


a) Calcule P(X <—3),P(X >—1),P(X <-4), P(X >-3), P(X >-3). 


b) Dibuje el diagrama de puntos e histograma de probabilidades para fy (x). 


5.6. En el ejercicio 5.3 encuentre P(X = 3), es decir, de que el equipo A gane el trofeo. Encuentre 
también la probabilidad de que el equipo A gane un juego o menos, o sea P(X <1). Dibuje el 
diagrama de puntos y el histograma de probabilidades para fy (x). 


5.7. La función de densidad de probabilidades que se grafica en seguida tiene por ecuación: 


fy(x) 


2-2x:0<x<1 


0, de otra forma 


fx w=] 


a) Verifique que es una función de densidad de probabilidades. 
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b) Obtenga P(X 20.5), P(X <0.2), P(0.3< X <0.5) (note que cualquiera de las áreas pedidas 


puede obtenerse calculando áreas de triángulos rectángulos). 


5.8. Obtenga la función de distribución acumulativa de probabilidades para la función de densidad del 
ejercicio 5.7 (pista: note, en el diagrama que sigue, que para x E (0,1), Fy((x) es el área sombreada, 
y que el área del triángulo no sombreado es fácilmente obtenible). Grafique la función. 


2 


fx (x)=2-2x 


5.9. Obtenga la función de distribución acumulativa para la fy (x) definida en el ejercicio 5.5. Grafíquela. 


5.10. Suponga que el número de interrupciones (por mes) de la corriente eléctrica (X) en un sector de una 
ciudad tiene la siguiente función de probabilidades: 


X 0 1 2 3 4 5 6 
fix) | 0.12 0.32 0.28 0.17 0.06 0.03 0.02 


a) Calcule E(X) y Elx?). 


b) Calcule o? usando la expresión (5.5). Obtenga O y. 


5.11. Calcule uy, 0% y Oy para la función de probabilidades del ejercicio 5.5. 


5.12. Utilizando la definición de esperanza matemática pruebe las propiedades (5.9) y (5.10). Es decir, 
demuestre que: 
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E(X+c)=E00+c, 
Elc,+c,X)=c, +c,E(X) 


En caso de que las demostraciones algebraicas se le dificulten, verifique estas propiedades utilizando la 
función de probabilidades fy (x) del ejercicio 5.10 como sigue: 


a) Defina la variable aleatoria Y = X + c,. Obtenga la función de probabilidades de Y, y de ella £(Y). 
En seguida aplique la regla (5.9) y compruebe que el resultado es el mismo. 


b) Defina la variable aleatoria Z = c} + c, X. Proceda como en (a) para verificar (5.10) (usando 


fy (x) del ejercicio 5.10, fy (c,)=0.12, fy (1+c,)=0.32, etc.). 


5.13. Demuestre, utilizando la definición de varianza y las propiedades de la sumatoria, las igualdades (5.13), 
(5.14) y (5.15). Si la prueba algebraica le resulta difícil, tome c =—1/5 y use la fy (x) del ejercicio 
5.10 para verificar (5.13) y (5.14). Para verificar (5.15), calcule ar con esa ecuación y compare el 
resultado con el obtenido en el inciso (6) del ejercicio 5.10. 


5.14. Considere la siguiente función: 


fx (x)=c(48+x—21?); x=-—3,-2,-—1,0,1,2,3,4 


a) Calcule el valor de c para el cual fy (x) es una función de probabilidades. 

b) Con ese valor de e calcule las probabilidades. 

c) Dibuje el histograma de probabilidades de la variable aleatoria X. 

d) Calcule la media, moda, mediana, varianza y desviación estándar de X. ¿Por qué es la media 


ligeramente mayor que la mediana y la moda? 


5.15. En la función de probabilidades que se presenta enseguida: 


calcule moda y mediana. 


5.16. En el ejercicio 5.2 se definieron las variables aleatorias Y y Z, como el número de individuos (de una 
muestra de dos) que únicamente hablan una lengua indígena y como el número de individuos que 


„i 
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sólo hablan español. Auxiliándose con el espacio muestral obtenido en el ejercicio 5.1 verifique que la 
distribución conjunta de Y y Z es la que se presenta en la siguiente tabla: 


0.0024 0.0004 


0.0368 0 
0 0 


De la distribución conjunta obtenga P(Y = Z) y P(Y < Z) 


5.17. En la siguiente distribución conjunta la variable aleatoria Y representa el número de días (en una 
semana) en que se consumió carne en una vivienda. La variable aleatoria X está definida de acuerdo 
con el número de habitantes de la población en que se encuentra ubicada la vivienda. Los valores para 
X han sido establecidos (arbitrariamente) con la siguiente escala: 


menos de 2500 habitantes: X = 1 10 000 a 19 999 habitantes: X = 4 
2500 a 4999 habitantes: X = 2 20 000 a 49 999 habitantes: X = 5 
5000 a 9999 habitantes: X = 3 50 000 o más habitantes: X = 6 


Los datos han sido adaptados del IX Censo General Mexicano de Población (1970) y el consumo de 
carne se refiere a la semana anterior al censo. Las probabilidades que se presentan son las frecuencias 
relativas obtenidas a partir de 8 286 369 viviendas. 


a) De esta distribución conjunta obtenga la distribución marginal de Y. Calcule E(Y) y Var(Y). 


b) Obtenga la distribución marginal de X. Calcule E(X) y Var(X). Note que, a diferencia de los 
momentos para Y, los de X no pueden interpretarse sin hacer referencia a la escala en que X está 


definida. Trate de interpretar E(X). 


5.18. Considere la siguiente distribución conjunta de probabilidades: 


uy. 
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+19, 


5.20. 


5.Z1, 


xy 
=—;x=1,2,3,4; y =1,2,3 
xy (x, y) = 60 z á 
0, de otra forma 


Encuentre las distribuciones marginales de Xy Y. Expréselas como funciones. 


Una compañía de servicios turísticos debe decidir, con 48 horas de anticipación un día cualquiera, 
el número de guías de que debe disponer en previsión de solicitudes de última hora para ese día. Un 
nuevo gerente que desea optimizar el rendimiento obtiene, mediante una muestra de los registros 
de los últimos 10 años, la siguiente distribución conjunta para X y Y, donde X es el número de 
solicitudes recibidas después de haber contratado al personal para una fecha, y Yel número de guías 
de turistas contratados por la empresa para la fecha en cuestión. Suponga que las frecuencias relativas 
obtenidas por el gerente pueden tomarse como probabilidades, y que cada solicitud únicamente 
requiere un guía. 


a) Obtenga la distribución de probabilidades de la variable aleatoria Z = X — Y, es decir, de número 
de solicitudes no atendidas por falta de personal disponible. 


b) Mediante la distribución de Z verifique la propiedad (5.18); o sea, compruebe que 
E(Z)=E(X)-E(Y). 


c) Calcule E(XY). 
d) Calcule Cov( X,Y ) mediante la ecuación (5.21). 
e) Calcule Cov(X,Y') mediante la ecuación (5.22). 


f) Calcule la correlación entre X y Y. Interprétela en relación con la efectividad del manejo de la 
empresa en los años en que se tomó la muestra. 


En la distribución conjunta del ejercicio 5.16 calcule la correlación entre X y Y. ¿Cómo debe 
interpretarse el signo negativo de la correlación? 


En el ejercicio 5.17 la variable aleatoria X se define de acuerdo con el número de habitantes de la 
población en que se ubica una vivienda, y la variable Y representa el número de días en que se consume 
carne en la misma. Calcule p yy e interprétela. 
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5.22. En el ejercicio 5.19 calcule Var (Z). Dado que Z = X — Y, utilice las distribuciones marginales de X 
y Y para verificar que Var (Z) = Var X)+Var(Y)-2Cov(X,Y ). 


5.23. En el ejercicio 5.18 se definió la distribución conjunta: 


Xy 
5 = 1,2, 4; = 1,2, 
Fxy (x,y)=360 aiin P 


0, de otra forma 


Utilizando las distribuciones marginales decida si Xy Y son variables aleatorias independientes. 


5.24. En la distribución conjunta del ejercicio 5.23 calcule Cov(X,Y ). Defina la variable aleatoria W = X 
— Y, y obtenga su función de probabilidades. Calcule Var (W). Usando las distribuciones marginales 
de Xy Y calcule Var(X) y Var(Y). Verifique que, en este caso, Var(X —Y ) = Var(X) +Var (Y). 
¿Por qué? 
¿ 


5.25. En la siguiente distribución conjunta, ¿son Xy Y independientes? ¿Por qué? 


Algunos modelos probabilísticos importantes 


6.1. Introducción 


En el capítulo 5 se estudiaron las propiedades de las distribuciones de variables aleatorias, tanto de tipo 
discreto como continuo. La mayoría de las funciones de probabilidad que allí se presentaron como ejemplos 
seron generadas arbitrariamente, cuidando sólo que cumplieran con las condiciones necesarias para ser 
distribuciones de probabilidades. La razón es que se buscaba tener funciones cuya expresión fuera sencilla, 
æn objeto de ilustrar los conceptos discutidos. Una vez conseguido ese propósito, ahora nos abocaremos al 
estudio de algunas funciones probabilísticas que tienen importancia debido a que describen el comportamiento 
de una gran variedad de fenómenos de la vida real. Cuando la distribución de una variable aleatoria permite 
representar —así sea de manera aproximada— el comportamiento aleatorio de una variable bajo estudio, 
decimos que tenemos un modelo probabilístico para la variable. En ese caso, es posible emplear las leyes de la 
pr obabilidad pu investigar las constantes que caracterizan al fenómeno cuyo comportamiento estudiamos a 


Un modelo probabilístico de una variable aleatoria Xes la forma especifica k la función de probabilidades 
que se supone refleja el comportamiento de X. 


Las probabilidades involucradas en el estudio de un fenómeno son descritas generalmente en términos de ciertas 
ənstantes (que llamaremos parámetros) características de la población que se estudia, y relacionadas también 


son el método empleado para obtener los datos. 


Las funciones de distribución de variables aleatorias que se estudiarán son las que han mostrado tener mayor 
rilidad como modelos probabilísticos. Ellas son, entre las discretas; la Uniforme, la Binomial Puntual o 
soull, la Binomial, la Hipergeométrica, la Poisson y la Binomial Negativa. Entre las continuas estudiaremos 
a Uniforme, la Normal, la ż de Student, la Ji-cuadrada (y?) y la F de Snedecor. Estudiaremos primero las 
distribuciones discretas. 


- de 
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6.2. Función de probabilidades Uniforme Discreta 


Una función de probabilidades muy sencilla y muy importante, tanto desde el punto de vista teórico como 
práctico, es aquella que describe el comportamiento probabilístico de un experimento en que cada uno de los 
posible resultados (hay un número finito de ellos) tiene la misma probabilidad de ocurrencia. Su importancia es 
capital en la rama de la estadística denominada Muestreo, y sirve como punto de partida para un gran número 
de resultados teóricos. 


Definición 6.1 (Distribución Uniforme Discreta). Una variable aleatoria X tiene distribución uniforme discreta 
si su función de probabilidades es 


1 
Fx (x)= a kyrk, 


0, de otra forma 


Donde » es el número de resultados posibles en el experimento, y los k;, son los valores que toma la variable 
aleatoria. 4 


Ejemplo 6.1. Considérese un experimento con el siguiente espacio muestral: 


M =(B,,B,,B,, B4» B;,) 
Donde los eventos {B; }, {B },... {Bs } forman una partición de M y además, 


P((83)=2((8,)=..=P((8,))=5 


La variable aleatoria X se define sobre M como sigue: 


X(B,)=1,X(B,)=3.1, X(B,)=4, X(B,)=4.5 y X(B,)=6 


Entonces, la función de probabilidades de X es la de la siguiente tabla. 
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O, en forma de ecuación: 


1 
=; x =1,3.1, 4, 4.5,6 
| fx (x)=35 


0, de otra forma 


a representación gráfica de la función tiene la siguiente forma. 


fx) 


1/5 


1 2 3 4 5 6 


Figura 6.1. Diagrama de puntos de una función de probabilidades uniforme discreta. € 


caso particular de mucha importancia se tiene cuando la variable toma como valores los primeros » enteros 
itivos. En ese caso la función de probabilidades está dada por: 


== LD e 
fx()=3n 


0, de otra forma 


estos posibles valores de X pueden darse expresiones sencillas para la media y la varianza de la variable 
ria. A saber: 
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Ejemplo 6.2. En el año de 1979 se encomendó a un auditor de la Secretaría de Hacienda revisar la 
declaración de impuestos de uno cualquiera de los 74 profesores del Colegio de Postgraduados. Para elegir 
al profesor, el auditor escribe los nombres de cada uno de los profesores en sendas tarjetas previamente 
numeradas. Después de revolverlas cuidadosamente, selecciona una de ellas y registra el nombre allí escrito. 
El espacio muestral resultante está constituido por los nombres de los 74 profesores. Sea X la variable 
aleatoria definida por (nombre del profesor) = número de la tarjeta con el nombre. La función de 


probabilidades de X es: 


1 
fx(x)= 74" 


0, de otra forma 


=1,2,..., 74 


La media y la varianza de la variable X son: 


1 
Ew = 2375 
Var(X) = 456.25 + 


6.3. Distribución Binomial Puntual o Bernoulli 


Consideremos un experimento cuyo espacio muestral M está integrado sólo por dos resultados posibles, 
los cuales por conveniencia denotaremos como éxito (£) y fracaso (F) , sin implicar que estos nombres 
tengan la connotación usual. En el espacio muestral resultante: M =(£,F) se considerarán los eventos 
mutuamente excluyentes {E} y {F}. A continuación se presentan situaciones reales que son descritas por 
este modelo. 


Ejemplo 6.3. 
a) En el ejemplo 4.12 a) se describió el experimento consistente en preguntar a un estudiante del curso 


introductorio de estadística su opinión sobre el profesor. Podemos registrar la respuesta como éxito si 
tiene mala opinión, y como fracaso si la opinión es buena. 
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b) Se inspecciona una planta de trigo con objeto de saber si se 
encuentra atacada por un hongo. Los resultados posibles se 
registran como éxito si no está infectada y como fracaso si lo 
está. 


c) Se observa en un aeropuerto la llegada de un avión y se anota éxito 
si el avión se estrella al aterrizar, y fracaso si ocurre lo contrario. € 


El modelo probabilístico que rige a experimentos como los descritos se ES 
denomina Binomial Puntual o Bernoulli, en honor de Jacobo Bernoulli > 
11654-1705), matemático suizo quien lo derivó. Los postulados que lo 
caracterizan se enuncian en seguida. 


Jacobo Bernoulli 
1654-1705 


"Si se define la variable aleatoria X sobre el espacio muestral M =(£,F) como sigue: 


X(£)=1, X(2)=0, 


La función de probabilidades de X recibe el nombre de Binomial Puntual o Bernoulli, y puede escribirse: 


Xx 0 1 
P(X=x) | 1-p P 


Es decir: 


fx (0)= P(X =0)= p (i1— p)” 
fx (D=PX=)=p9 (=p 
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De manera que en forma general puede escribirse: 


pap; £=0,1 


r=] 


0, de otra forma 


Lo anterior se resume en la siguiente definición. 


Definición 6.2 (Distribución Binomial Puntual). La variable aleatoria X tiene la distribución Binomial Puntual 
o Bernoulli, si su función de probabilidades está dada por: 


Ka a NE 
nol A 


0, de otra forma 


Donde 0<p<1 


Ejemplo 6.4. Suponga que de una manada de caballos, de los cuales 3 están enfermos y 30 están sanos, se elige 
uno de acuerdo con un modelo uniforme, es decir, de tal forma que cada caballo tiene la misma probabilidad de 
ser escogido. Se registra si el caballo está enfermo, en cuyo caso se anota éxito; en caso contrario se anota fracaso. 


El experimento satisface los postulados de un modelo probabilístico Binomial Puntual con p = P(E) = 5 » 


La variable aleatoria X definida para el experimento tiene la función de probabilidades: 


(3/33) (1-3/33)"*;x=0,1 


0, de otra forma 


fx w=] 


O sea que la probabilidad de que el caballo elegido esté enfermo es: 
fx = P(X =1)=(3/33) (1-3/33)” =3/33 
y la probabilidad de que esté sano es: 
fx 0) = P(X =0)=(3/33) (1-3/33)"=30/33 y 


Media y Varianza de la distribución Bernoulli 


Si X es una variable aleatoria Bernoulli, su media es: 


1 
ux = EGO = Y af =O= f= p 


x=0 


calcular la varianza obtenemos E (x?) 


1 
EX’ Y= X x fe = 0 OH f= p 


x=0 


2 varianza es, entonces, 


a =E(x?)-u =p-p?= p(1-p) 


. Función de probabilidades Binomial 


En la sección 6.3 se consideró un experimento en el que el resultado necesariamente es uno de dos eventos 
utuamente excluyentes, es decir, que los elementos de la población pertenecen exclusivamente a dos clases; por 
sjemplo, macho o hembra, sano o enfermo, rico o pobre, etc. Supongamos que se llevan a cabo » repeticiones 
idependientes de un experimento de este tipo, de manera que en cada una de las repeticiones la probabilidad 
del evento que llamamos éxito es la misma. Es decir, que p = P({E}) permanece constante a lo largo de las » 
repeticiones del experimento. Sea X, la variable aleatoria Bernoulli definida en el espacio muestral de la primera 
repetición del experimento, o sea que X,(£,)=1 y X,(4)=0. Similarmente sean X, Xy,..., X, variables 
aleatorias Bernoulli definidas en las repeticiones 2, 3,..., n, respectivamente. Si definimos la variable aleatoria X 
como el número de éxitos que se tienen en las » repeticiones, es claro que la nueva variable aleatoria es la suma 
de las n variables definidas previamente, es decir: 


X=X +X,+..+X, 


Una situación como la descrita es posible ejemplificarla con el nacimiento de una camada de 4 cerdos, si se 
registra el sexo de cada uno de ellos. Si llamamos éxito al evento consistente en que uno de los lechones sea 
hembra, y fracaso a que sea macho, es evidente que se tienen 4 repeticiones independientes de un experimento 
- Bernoulli, ya que el sexo de uno de ellos al nacer no afecta el sexo de los demás. También es claro que si la 
- probabilidad de que el primer individuo examinado sea hembra es p, esta probabilidad es la misma para los 4 
lechones, o sea que P((£,))=P((£,))= P(LE, y) = P({E;}) = p. La variable aleatoria X, definida como el 
número de lechones de sexo femenino, puede tomar los valores 0, 1, 2, 3, 4. El valor cero lo toma cuando los 4 
lechones son de sexo masculino, es decir, cuando X, = 0, X = 0, X = 0, y X, = 0. El valor uno lo toma cuando 
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z . 4 : . 
una y sólo una de las variables X; toma el valor uno, etc. Los 16 = 2* resultados posibles del espacio muestral 
para X se listan en seguida convenientemente agrupados. 


Valores de X 


Espacio muestral 


Puede observarse que las secuencias que se han generado están constituidas; para X = 0, por cero éxitos y 4 
fracasos; para X = 1, por un éxito y 3 fracasos; para X = 2 por 2 éxitos y 2 fracasos y, en general, por x éxitos y 
4 — x fracasos. Dada la independencia entre las repeticiones, la probabilidad de cada una de las secuencias es el 
producto de las probabilidades de los eventos que las componen. Así, por ejemplo: 


P(EBEF))=(1- X= p)1— pp) p)=(1- pY 
P({E EEF })= p p p(l- p)= p* (1-p), 


š bos > qe 4=x 
de modo que una secuencia con x éxitos y 4 — x fracasos tiene probabilidad p*(1— p)”*. Ahora, el valor 
X = 3, por ejemplo, ocurre con cualquiera de 4 sucesiones, las cuales constituyen eventos mutuamente 
excluyentes, de modo que: 


P(X=3)= P((RE,E,E))+((EBE,E,))+P((£,E,R,E,)) 
+P((E,E,E,F,))=4p*(1- p) 


Similarmente pueden obtenerse las demás probabilidades: 


l 2 3 á 


4p'(1-pf 6p -pf  4pP(-p 1#- p 


Los coeficientes 1, 4, 6, 4 y 1 de la tabla pueden expresarse más convenientemente mediante el símbolo de 
combinatoria, del cual se da una explicación breve para los lectores no familiarizados con este símbolo. Si ¢ y d 


+ . + E « . . 
son dos números enteros no negativos tales que d < c, el símbolo debe leerse “combinaciones de c tomadas 


de den d”, y tiene como expresión: 


- HD. 
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C el 
(Ja 
donde el símbolo c! debe leerse “factorial de c”, y es igual a: 
cl=clc—1)Mec—2)-"3-2-1 
y el factorial de cero se toma, por definición, como uno. 


7 
¡Como un ejemplo considérese el valor de : , el cual, de acuerdo con lo anterior, es: 


N_N A 7654321 _20_35 
3) 37-3) 314 (3-2:1)(4-3-2-1) 6 


Usando esta notación es fácil verificar que: 


4 4 
o)” 
4i di 
Wia 
4 4 
P 
4 4 
hag 
4 4! 
H 


Lo que puede expresarse mediante la ecuación: 


4 4—x 
Mra (1-p)"*;x=0,1,2,3,4 


0, de otra forma 


fx(x)= 
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Si extendemos el razonamiento para el caso de 7 repeticiones independientes de un experimento Bernoulli con 
probabilidad p de éxito, la variable aleatoria X, definida como el número de éxitos obtenidos en los z intentos, 
o lo que es lo mismo como la suma de las variables Bernoulli correspondiente a cada experimento, tiene la 


siguiente función de probabilidades: 


Í (x) | ) (1— p) E = 0,1, 2,..., 
0 d 


, de otra forma 


El modelo probabilístico para experimentos como el descrito recibe el nombre de Binomial. 


Definición 6.3 (Distribución Binomial). Una variable aleatoria X se distribuye de acuerdo con un modelo 
probabilístico binomial si su función de probabilidades es: 


n 
fe) = X 


0, de otra forma 


PUp an 


Donde 0<p<1 


Ejemplo 6.5. Un proceso de grabación de discos produce un 20% de unidades defectuosas. Suponga que se toma 
una muestra de tamaño 8, cuidando que la proporción de defectuosos se mantenga constante en la población, 
y que cada disco en ésta tenga la misma probabilidad de ser incluido en la muestra. Es decir, que los discos se 
eligen de acuerdo con una función de probabilidades uniforme. ¿Cuál es la probabilidad de que no se encuentren 
discos defectuosos en la muestra? ¿Cuál es la probabilidad de que se encuentren 5 o más discos defectuosos? 


El experimento consistente en tomar aleatoriamente un disco y anotar si es defectuoso o no, sigue el modelo 
Bernoulli, y la toma de 8 unidades en la forma descrita arriba es equivalente a 8 repeticiones independientes del 
experimento. Sea X la variable aleatoria que cuantifica el número de discos defectuosos (éxitos) en la muestra. 
Entonces X tiene una distribución Binomial con parámetros n = 8 (el número de repeticiones) y p = 0.2 (la 
probabilidad de éxito en una repetición). La función de probabilidades de X es: 


Capitulo 6 
ALGUNOS MODELOS PROBABILÍSTICOS IMPORTANTES 


8 
Ads ea (0.8%; x =0,1,2,...,8 
v(x)= 


0, de otra forma 


Explícitamente estas probabilidades son: 


8 
0 
8 
1 
8 
2 
8 
3 


fx(0)=P(X =0)=|_ |(0.2)*(0.8)* =(0.8)' =0.16777 


AM=PX=1 = 


fx(2)=P(X =2)=|_ |(0.2) (0.8) =28(0.2) (0.8) = 0.29360 


fx(8)= P(X =3)=|, [(0.2) (0.8 =56(0.2) (0.8) =0.14680 


4 


8 


fx(5)= P(X =5) =| _ |(0.2) (0.87 =56(0.2) (0.8) =0.00918 


i 


8 


$ (0.21 (0.8)? = 28(0.2)f (0.8)? =0.00115 


f,(6)=P(X=6)= 


00 


( 
4(0.81* =70(0.2)*(0.8)* = 0.04588 
(0.8)! =8(0.2) (0.8) = 0.00008 
( 


Amera [0.27 


N 


8 


( 
(0.2) (0.8) =8(0.2)' (0.87 = 0.33554 
8 ) 


0 
0.8)? = (0.2) (0.8)? = 0.00000 


A= =0=]. [02 


ol 
a 
2 
sl 
fx(4)= P(X =4)= joa 
5 
sl 
gloa 
o) 


fas cifras están redondeadas a cinco decimales). 


En forma de tabla se tiene: 


P(X =x) 


0.16777 
0.33554 
0.29360 
0.14680 
0.04588 
0.00918 
0.00115 
0.00008 
0.00000 
1.00 


Ma 3 /A Ye y fa a + O 
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De aquí pueden contestarse las preguntas planteadas (y otras muchas). La probabilidad de no encontrar discos 
defectuosos es: 


P(X =0)=0.16777 
La probabilidad de encontrar 5 o más discos defectuosos es: 


P(X>25)=P(X=5)+P(X =6)+P(X =7)+P(X =8) 
= ().00918+0.00115+0.00008 + 0.00000 = 0.01041 


Nótese que, puesto que la suma de probabilidades tiene que ser uno, la probabilidad de 5 o más defectuosos 
también puede calcularse como sigue: 


4 
P(X>5)=1-P(X<4)=1- Y P(X=x)=0.01041 
x=0 $ 


En la tabla A se presentan probabilidades acumuladas de Bin(n, p) para diferentes valores de » y p. Para cualquier 
miembro de la familia Binomial con » y p especificados se tienen las probabilidades acumuladas hasta un valor 
c de la variable aleatoria. Por ejemplo, con los parámetros n = 10 y p = 0.4, para c = 2 se lee en la tabla A el 
valor 0.1672; esto quiere decir que: 

2 2 /10 

Y Bin(10,0.4)= Y p jos (0.6}°* =0.1672. 


x=0 x=0 


Media y Varianza de la distribución Binomial 


Si X es una variable aleatoria cuya función de probabilidades es Binomial, entonces, como ya se dijo, 
X =X, +X, +...+ X, , donde cada variable en la suma tiene una distribución Bernoulli con probabilidad p 
de éxito; además, las variables son mutuamente independientes. De donde, usando las propiedades de la media y 
la varianza estudiadas en el capítulo 5, y recordando que la esperanza de una variable con distribución Bernoulli 
es p y su varianza es Pp = p) = pq, se encuentra: 


E(X)=E(X, +X,+..+X,)=E(X,)+ E(X,)+..+E(X,) 
=p+p+..+p=nmp. 
VarX)=Var(X, +X, +..+X,)=Var(X,)+Var(X,)+...+Var(X, ) 
= pq+pq+..+ pq=npg. 
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‘n el ejemplo siguiente se presentan distribuciones de probabilidades para varios valores de p, manteniendo 
fijo, con objeto de que el lector adquiera una idea de las diferentes formas que puede tomar la distribución. 


plo 6.6. En las Figuras 6.2.4 a 6.2.d se presentan histogramas de probabilidades para 4 distribuciones 
miales con el mismo parámetro n (n = 4) y diferentes valores de p. 


(x) fu (x) 


n=4,p=0.1 n=4,p=0.3 
=4(0.1)=0.4 =4(0.3)=1.2 
0.6561 Px (0) Pr 
o% = 4(0.1)(0.9)=0.36 a% =4(0.3)(0.7)=0.84 


0.0036 0.0001 


f(x) 
n=4,p=0.5 n=4,p=0.7 
Az =4(0.5)=2 (d) My =4(0.7)=2.8 
o% =4(0.5)(0.5)=1 o% = 4(0.7)(0.3) =0.84 


Figura 6.2. Histograma de probabilidad para cuatro distribuciones binomiales. 


atro casos presentados en el ejemplo 6.6 pueden observarse varias características de la distribución que 
en general, las cuales se listan a continuación: 


= 
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a) Para valores pequeños de p(p<0.5) las probabilidades mayores se dan para valores pequeños de X. 
Esto es congruente con el modelo probabilístico propuesto, ya que en estos casos la probabilidad de éxito 
en cada repetición es menor que la probabilidad de fracaso. El histograma tiene una larga cola hacia 
la derecha. Lo contrario ocurre con valores de p mayores de 0.5, teniéndose entonces distribuciones 
asimétricas a la izquierda. 


b) La distribución es simétrica para p = 0.5. Esto se debe a que en este caso las probabilidades están dadas 


n 


por |. (1/2)”, y también a que 


n 


gn (Ver ejercicio al final de este capítulo). 


Xx 3 


c) La distribución tiene varianza máxima para p = 0.5 


6.5. Función de probabilidades Hipergeométrica 


La distribución Binomial se generó al discutir 2 repeticiones de un experimento Bernoulli, en el cual hay dos 
resultados posibles. Las probabilidades asociadas a cada repetición se supusieron constantes, y se supuso además 
que las repeticiones son independientes. Supongamos ahora repeticiones de un experimento del mismo tipo, 
pero con la diferencia de que las repeticiones no son independientes. Es decir, que si E, y E, son éxito en el 
primer intento y éxito en el segundo, PUE E, ) = P([E,)). Para ilustrar la situación que se propone, 
consideremos el experimento consistente en extraer sucesivamente 7 elementos de una población finita con N 
elementos (1 < N), sin devolver un elemento antes de extraer el siguiente, o sea que un elemento no puede 
aparecer dos veces en la muestra. A esta forma de obtener la muestra se le llama Muestreo sin Reemplazo. Cada 
uno de los componentes de la población pueden clasificarse en una de dos categorías mutuamente excluyentes, 
según si poseen o no una cierta característica. En la práctica, estas categorías pueden ser plantas enfermas o 
sanas, individuos con empleo o desempleados, etc. Debido al hecho de que el modelo que se está describiendo 
es muy útil en la industria, a estas categorías se acostumbra llamarles Defectuosa y Aceptable. Obsérvese que 
la diferencia fundamental con el modelo Binomial es que el muestreo sin reemplazo origina la dependencia 
probabilística que ya se señaló, puesto que la frecuencia relativa de defectuosos en un intento depende de 
cuántos defectuosos hayan aparecido con anterioridad. Similarmente a como se hizo en el modelo Binomial, 
definimos la variable aleatoria X como el número de defectuosos (éxitos) obtenidos en las » repeticiones del 
experimento; es decir, el número de defectuosos en la muestra. Sean A el número de defectuosos en la población 
y B el número de aceptables. El tamaño de la población es entonces N = A + B. Queremos obtener fy (x), 
la función de probabilidades del número de defectuosos. En lo sucesivo nos comportaremos como si el tamaño 
de la muestra » fuese siempre menor o igual que A y que B. En caso contrario algunos valores de fy (x) serán 
cero. Para derivar la función de probabilidades de X razonamos como sigue: 


X toma el valor cero sólo si los n elementos son aceptables. La probabilidad de que esto ocurra es: 


B B-1 B-2 B—-n+1 
fx Dept DL A a E, 
Í N N-1N-2 N-—-n+l 


y ésta es la única secuencia posible. 


X toma el valor uno si una cualquiera de las » repeticiones produce un sistema defectuoso. La probabilidad de 
que el primero sea defectuoso es: 


Capítulo 6 
ALGUNOS MODELOS PROBABILÍSTICOS IMPORTANTES 


N N-=1 N-2 N-mrl 


B A B-1 B=n+2 


Y Na Na Net 


y es evidente que estas dos últimas expresiones son iguales. De hecho, la probabilidad es la misma 
n 
independientemente de la posición que el defectuoso ocupe en la secuencia. Puesto que hay 7, o ¡ | Secuencias 


con la misma probabilidad, se tiene: 


pnrt] A B _ B-1 B-=n+2 


Consideremos ahora el valor X = 2. La probabilidad de que los únicos defectuosos sean los dos primeros es: 


A A-1 g B=1 Busta 


N N-i N-22 N-53 N=] 


n 
Las secuencias posibles son todas las formas de escoger dos lugares de un total de », es decir, (i) Sin embargo, 


odas las secuencias tienen la misma probabilidad. Por ejemplo, la probabilidad de que el primero y el tercero 
sean defectuosos es: 


por lo que: 


pora) SA, Y Za Ma 


Podría continuarse con otros valores de X, pero el patrón ya es aparente. La función de probabilidades de 


X es: 


TA KACA- "(Ax +D][B(B=D)+(B=2+x+1) 
a NIN -D(W -2)--(N=n+1) 


la cual puede escribirse como: 
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la] 
n\|(A—x)! (B=n+x)! 
Fy (x)= (i) 2 NI cdi 


(N =n)! 


siempre que n S Ayn < B. 
A esta función de probabilidades se le llama Hipergeométrica. 


Definición 6.4 (Distribución Hipergeométrica). Se dice que el modelo probabilístico de una variable aleatoria X 
es Hipergeométrico si su función de probabilidades es: 


AN B 
Xx hal 
fi) =P(X=x)= Me n<AynsB 


n 


0, de otra forma 


Donde N = A + Bes el número de elementos en la población, A y B el número de defectuosos y aceptables en 
la población respectivamente, 7 el tamaño de la muestra y x el número de defectuosos en la muestra. ¢® 


Ejemplo 6.7. Un vendedor de insecticidas quiere vender a una planta un lote de 50 barriles de un producto, 
que el gerente de la planta sospecha han pasado la fecha de caducidad. El vendedor sostiene que sólo el 20% 
(10 barriles) ha caducado y está dispuesto a permitir que se analicen cinco barriles sin costo para el comprador, 
para que éste decida si adquiere el lote. ¿Cuál es la probabilidad de que el gerente encuentre que 4 ó más de los 
5 barriles examinados han caducado, suponiendo que el vendedor tiene razón? 


Aceptando la afirmación, del vendedor, el número de barriles caducos en la población es A = 10, y por lo tanto, 
B = 40. El tamaño de la muestra es » = 5. La función de probabilidades de la variable X, definida por el número 
de barriles defectuosos en la muestra es: 
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(Js) 


fx == x=0,1,2,3,4,5 


La probabilidad deseada es: 
H 40 | HATA 
5 {x j{5-x 4 j| 1 SINO 
AA O 
5 5 


2 
= 8400+252 L 0,00396 +-0.00012 = 0.00408 
2118760 


De modo que si el cliente encuentra que 4 o más barriles han caducado, es difícil creer en la afirmación del 
vendedor, ya que si éste tiene razón, esa probabilidad sólo es 0.00408. 


Para destacar la diferencia entre esta distribución y la Binomial suponga que el gerente, haciendo caso omiso 
de que la población es finita, calcula sus probabilidades usando el modelo Binomial, es decir, suponiendo que 


X ~ Bin(5,0.2). La probabilidad calculada sería: 
3 15 
HXZ248= Y loza) 
x=4 


5 4 5 5 0 
= 4 (0.2)*(0.8)+ 5 (0.2) (0.8) 


= 0.00640 + 0.00032 = 0.00672 


y puede verse que esta probabilidad es más de 50% mayor que la correcta. Las probabilidades son más parecidas 
si Nes muy grande o si z es muy pequeña en relación con N. Esto se discutirá al final de esta sección. ® 


Ejemplo 6.8. Suponga que se pescan $ peces en un lago, se marcan y se devuelven al agua. Después de un cierto 


siempo (suficiente para que se mezclen pero no para que se produzca una nueva generación) se pescan $ peces de 
muevo y se anota el número (digamos 7) de ellos que están marcados. La probabilidad de m peces marcados es: 


P(X=m)= | 
(a) 


donde N, el número de peces en el lago, es el único valor desconocido. 4 
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Media y Varianza de una distribución Hipergeométrica 
En seguida se presentan, sin probarlos, dos resultados importantes. 
En la función de probabilidades Hipergeométrica se tiene: 


E(X)=np (6.7) 
Var(X)=npa(N -nI N-1) (6.8) 


donde: 


e S 
P HTS P 


Ejemplo 6.9. En el ejemplo 6.7 se tiene una distribución Hipergeométrica con A = 10, B = 40 y n= 5. En 
ese caso: 


[140 45) 
no 2/5) =0730 


Si se usa (incorrectamente) la distribución Binomial se obtiene: 


y las medias son iguales, pero la varianza en el modelo Hipergeométrico es menor que en el Binomial. 4 


En seguida se discuten algunas semejanzas y diferencias entre los modelos Hipergeométrico y Binomial. 
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6.6. Función de probabilidades Poisson 


Una forma sencilla de generar el modelo probabilístico que se conoce como Poisson es considerar un número 
muy grande de repeticiones de un experimento Bernoulli, con probabilidades de éxito muy pequeñas. Bajo 
ciertas condiciones, la distribución de la variable X, definida como el número de éxitos en las » repeticiones, se 
aproxima (cuando » tiende a infinito) a la función de probabilidades Poisson. Por esta razón se considera a veces 
el modelo Poisson como una forma límite de la distribución Binomial y se utiliza para aproximar probabilidades 
en ésta. Aparte de su uso como una aproximación a la Binomial, la Poisson sirve como modelo para experimentos 
donde los eventos ocurren en intervalos de tiempo o espacio y nos interesa el número promedio de ocurrencias en 
el intervalo. En este caso se supone que cada repetición del experimento Bernoulli que genera el espacio muestral 
ocurre en cada punto del intervalo y, por lo tanto, el número de repeticiones puede considerarse infinito. Como 
ejemplos específicos de fenómenos que pueden representarse por este modelo tenemos: el número de partículas 
de polvo en cierto volumen de aire, las llamadas en una línea telefónica por unidad de tiempo, el número de 
errores de imprenta por página en un libro, el número de accidentes por día en una bocacalle, el número de 


insectos por planta en un cultivo, etc. 


Los postulados que rigen a un experimento cuyo modelo probabilístico es Poisson se anotan enseguida. 
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Para aclarar el significado de estos cuatro postulados presentamos el siguiente ejemplo. 


Ejemplo 6.10. Anteriormente se dijo que el número de accidentes automovilísticos por día en un cruce de calles 
puede representarse por un modelo Poisson. En seguida analizamos lo razonable de los cuatro postulados en 
esta situación: 


i; 


2, 


Si consideramos un lapso, tan pequeño como se quiera, pero que puede ser (para propósitos prácticos) 
un segundo, y tomamos como éxito que ocurra un accidente en ese lapso, tenemos, en el intervalo de 
tiempo que es un día, 86 400 segundos, o sea 86 400 repeticiones de un experimento Bernoulli. La 
probabilidad de éxito en cada repetición es muy pequeña. 


Aquí, cada intervalo /, es un día. Es razonable suponer que el número de accidentes en un día es 
independiente del número de accidentes en otro día cualquiera. Esto no ocurre, por ejemplo, con el 
número de personas que adoptan una moda en un día determinado, ya que una moda tiene una etapa 
creciente, un apogeo y una etapa decreciente. En estas condiciones se dice que existe contagio, y el 
modelo probabilístico no puede suponer independencia entre los intervalos. En ese caso el modelo 
apropiado es una distribución llamada “de contagio”, como la distribución Binomial Negativa que se 
estudiará en la sección 6.7. En el caso del modelo Poisson se dice que no existe contagio. 


Puesto que una repetición del experimento Bernoulli ocurre cada segundo, es razonable suponer que no 
pueden ocurrir dos accidentes en el mismo segundo. 


Mientras las condiciones de vialidad no cambien en la bocacalle, puede suponerse que el número 


promedio de accidente por día (4) permanece constante. 
+ 


Es dificil, con las herramientas de que disponemos, derivar la función de probabilidades de una variable 
aleatoria cuyo modelo probabilístico es Poisson. En seguida se presenta una definición de esta función de 


probab 


ilidades. 


Definición 6.5 (Distribución de Poisson). Una variable aleatoria X tiene una distribución Poisson si su función 


de probabilidades está dada por: 


cl 
y la 
e 


fy&œ)=; x! 


0, de otra forma 
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Donde e = 2.71828 es la base de los logaritmos naturales y Å es un número (desconocido) mayor que cero. € 


La función de probabilidades Poisson debe su nombre a su descubridor, el 
matemático francés Siméon Denis Poisson (1781-1840). En seguida se ilustra 
con un ejemplo el cálculo de probabilidades en esta distribución. 


Ejemplo 6.11. Un entomólogo examina una planta de algodonero, contando 
el número de huevecillos de un insecto (Helliothis sp.) por planta. De estudios 
anteriores se sabe que bajo las condiciones del experimento el número de 
huevecillos por planta puede representarse por una distribución de Poisson 
con À = 0.9. Las probabilidades de que el entomólogo encuentre 0, 1, 2,..., 
huevecillos por planta son: 


pe $ Siméon iiir AA 

P(X =0)= fy(0)=* 09% 0,40657 

= — X — 1 me . 

—0.9 1 

P(X =1) = fy(1) O 06591 
0.9 2 

P(X =2)= f,(2)= e = 0.16466 
—0.9 3 

P(X =3)= f,(3)= ea = 0.04940 
=(0:9 4 

P(X 9- 09 2 001111 
—0.9 5 

P(X=5)= fr(5)= e = 0.00200 
—0.9 6 

P(X =6)= f,(6)= A = 0.00030 
—0.9 7 

P(X=7)= fx(7)= A = 0.00004 


El lector puede verificar que las probabilidades para X = 8, X = 9,..., etc., son cero con una aproximación a 5 
decimales, por lo que no vale la pena calcularlas. De hecho, es fácil verificar que: 


7 _—0.9 x 
P(X<7)= Y LC 


x=0 


= 0.99999 


0 
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Es decir, que la probabilidad de encontrar 7 o menos huevecillos en una planta es prácticamente uno, aunque 
la variable aleatoria puede tomar cualquier valor entero positivo. Lo que ocurre es que la probabilidad de 
que X tome valores grandes es muy pequeña. Por ejemplo, con 4 = 0.9 la probabilidad de que tome el 
valor 10 es: 


09 (0.9) 
P(X =10)= fy (10,4=0.9)= EE A 0.000000039. 


Estas probabilidades dependen del parámetro Å. Si A es grande, las probabilidades para valores grandes de X 
aumentan. Por ejemplo, con Å = 3 tenemos: 


e? (3) 
10! 


= 0.00081 


P(X =10)= fy (10,4 =3)= 


que es mayor que cuando 4 = 0.9. En cambio, las probabilidades para los valores pequeños de X disminuyen. 
Se recomienda al lector verificarlo. 6 


En la tabla B se presentan probabilidades acumuladas de la Poisson para algunos valores de 4. Bajo cada columna 
que da un valor de A se presentan valores de: 


c Pay hi 
P(X<c)= $ 


x=0 


x! 


Así, para À = 1 encontramos, para c = 2, el valor 0.9197; lo que significa que: 


mar CO, CO 
0! |! 2! 


P(X 22)=É 
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De acuerdo con lo anterior, si se desea aproximar el cálculo de probabilidades en una variable Bin(n, p) por 
una Poisson, recordando que la media de la Binomial es np, la aproximación correcta es con una Poisson con 
4 = np. Debe reiterarse que para que la aproximación sea buena se requiere que 7 sea grande y p sea pequeña. 
En seguida se presenta un ejemplo. 


Ejemplo 6.12. Suponga que una variable aleatoria X tiene distribución Bin(100,0.001). En seguida se presentan 
algunas probabilidades correctas y su aproximación por una Poisson (0.1). 


X ~ Bin(100,0.001) 


PS (0. i 


(0.001)%(0.999)'% = 0.90479 <a 0.90483 


—0.1 1 
9 (0.1) 
(0.001)'(0.999)” =0.09057 | ——=0.09048 


—().,1 2 
; : (0.1) 
(0.001) (0.9993 =0.00449 | 2 =0.00452 


21 


e 1 (0.1 y 
I 


(0.001) (0.999) = 0.00015 =0.00015 


De donde puede verse que bajo las condiciones especificadas las probabilidades son prácticamente iguales. ® 


6.7. Función de probabilidades Binomial Negativa 


En esta sección consideramos otro modelo probabilístico generado suponiendo repeticiones de un experimento 
Bernoulli con probabilidad p de éxito en cada repetición. En un modelo Binomial la pregunta es: ¿cuál es 
la probabilidad de que en » repeticiones se obtengan exactamente k éxitos (+ =0,1,... 1)? Supóngase ahora 
gue la pregunta es: ¿cuál es la probabilidad de que, para que se obtengan k éxitos, se requieran » repeticiones? 
Nótese que la pregunta se ha invertido. En el primer caso el número de repeticiones está fijo, y la variable 
aleatoria es el número de éxitos. En el segundo caso el número de éxitos se fija de antemano, y la variable 
aleatoria es el número de repeticiones necesarias para obtener los éxitos requeridos. Por esta razón se dice 
que en la situación que ahora se describe se tiene un Muestreo Binomial Inverso. La derivación de un modelo 
probabilístico para la variable aleatoria “número de intentos” es sencilla. Se está repitiendo un experimento 
Bernoulli con probabilidad p de éxito en cada intento, y el proceso se detiene cuando se obtienen exactamente 
E éxitos. Esto quiere decir que el intento 2-ésimo (el último) forzosamente es un éxito, y que en los primeros 
æ — l intentos se obtienen k — 1 éxitos. La probabilidad de obtener k — 1 éxitos en n — 1 repeticiones 
independientes de un experimento Bernoulli con probabilidad p de éxito se obtiene mediante la distribución 
Binomial, y es: 


n—1 
k—1 a n—k 
Pa (1-2) 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


mientras que la probabilidad de obtener un éxito en la n-ésima repetición es p. Por la independencia de las 
repeticiones, la probabilidad de que se requieran exactamente » repeticiones para obtener k éxitos es el producto 
de esas probabilidades, es decir: 


fy(m)= (jr ay lb 


je Qe 


para n = k, k + 1, k + 2,... Nótese que el valor mínimo de la variable aleatoria N es k. La función de 
probabilidades así derivada recibe el nombre de Binomial Negativa. 


Definición 6.6 (Distribución Binomial Negativa). Una variable aleatoria N tiene la distribución Binomial 
Negativa si su función de probabilidades es: 


1 
Ín (n)=P(N =n)= a q 


0, de otra forma 


Los parámetros de la distribución son % y p. La notación que se usará es: N ~ BN (%, p). 


Las semejanzas y diferencias en la notación para la Binomial y la Binomial Negativa se anotan en seguida. 


Función de probabilidades Variable aleatoria Parámetros Valores de la variable aleatoria 


Binomial X n, p X =0,1,2,...,1 
Binomial Negativa N k, p N =k,k+1,... 


Ejemplo 6.13. Un investigador somete semillas de trigo (Triticum sp.) a una dosis de radiación, y registra si su 
capacidad de germinar ha sido destruida por la radiación. De estudios previos se sabe que la probabilidad de que 
la capacidad de germinar se destruya con esa dosis es 0.8. El investigador desea obtener 3 semillas dañadas. Las 
probabilidades de que se requieran 3, 4, 5,... intentos son: 


a 


P(N =3) 
P(N =4) 
P(N =5) 
P(N =6) 
P(N =7) 
P(N =9) 
P(N =10)= 
etcétera. 


2 


N 


Jo 8) (0.2) =0.51200 


uy 


(0.8) (0.2) = 0.30720 


E N 


(0.8} (0.2)? =0.12288 


Vv N 


(0.8) (0.2)? = 0.04096 


(0.87 (0.2) = 0.01229 


N 


| 
) 
| 


y [Jo 8) (0.2) =0.00344 


s 


(0.8) (0.2) = 0.00092 


OO N 


Jo. 8)(0.2 =0.00024, 


N 
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- Nótese que las probabilidades se encuentran concentradas para valores de N cercanos a k, al grado de que 
P(N <10)=0.99993 . Esto se debe a que la probabilidad de éxito en un intento es grande (0.8). 6 


Alternativamente, algunos autores caracterizan a la distribución Binomial Negativa por el número de fracasos 
| que se registran antes de obtener $ éxitos. Es decir, definen la variable aleatoria N’ = N —k , donde claramente 


N'= 


0,1,2,..., es el número de fracasos. Con argumentos similares a los usados para N puede probarse que: 
a e a PA 
fu (n)= pr |? q” ,n'=0,1,2,... 


donde: 


P(N’ 


=n')=P(N=n'+k) 
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Con respecto a esta nueva variable aleatoria debe decirse que el propósito de ese cambio es que los valores 
empiecen en cero. Usando las reglas para el cálculo de la esperanza y la varianza estudiadas en el capítulo 5 
obtenemos: 


E(N)=kq!p 
Var(N')= kql p° 


Si denotamos por m a la esperanza de N”, es decir que m = kq / p, entonces: 


Var(y)= LD A 
p Pi y 

La pa mp 

p Ne) p k 


La distribución Geométrica o distribución de Pascal 


Un caso particular muy importante de la distribución Binomial Negativa se da cuando se tiene $ = 1. 
importancia es evidente si consideramos una situación en la que la observación de un solo éxito nos obliga 
tomar una acción. Como ejemplos tenemos: que aparezca un sólo caso de una enfermedad mortal previamen 
inexistente en un país, que se encuentre una planta atacada por un hongo en un invernadero, etc. Si k= 1, k 
función de probabilidades de N, el número de intentos necesarios para obtener un éxito es: 
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l 
:m=1,2,... 


fn (n)= 21 


0, de otra forma 


Y su media y varianza, casos particulares de (6.11) y (6.12), son: 


E(N)=1/p (6.15) 


Var(N)=q1 p? (6.16) 


La distribución del número de intentos cuando $ = 1 recibe el nombre de 
Distribución Geométrica o Distribución de Pascal, en honor de Blaise 
Pascal (1623-1662), matemático y filósofo francés con contribuciones muy 
importantes a la teoría de la probabilidad en sus inicios. 


6.8. Algunas consideraciones para la elección de un 
modelo probabilístico discreto 


El lector debe haber notado que casi todos los modelos probabilísticos que 
se han presentado pueden derivarse considerando una suma de variables 
aleatorias Bernoulli. Esta presentación —hay otras posibles— se escogió para 
dar una idea de cómo elegir un modelo para una situación dada. En seguida 
se resumen las ideas ya presentadas y se esbozan algunas otras. 


Blaise Pascal 
1623-1662 


1. La forma en que se realiza el experimento (o se toma la muestra) es importante. Si las variables Bernoulli 
son independientes (la población es infinita o el muestreo es con reemplazo) el modelo adecuado 
es Binomial. Si las observaciones son dependientes debe usarse el modelo Hipergeométrico. Si las 
observaciones se realizan en todos los puntos de un intervalo de tiempo o espacio, y la probabilidad de 
éxito es pequeña, puede usarse un modelo Poisson, siempre y cuando las ocurrencias en los intervalos 
sean independientes. 


2. El modelo Binomial Negativo es útil en cuando menos dos situaciones: una, ya analizada, surge 
cuando se tiene un esquema de muestreo binomial inverso, y la otra, similar a la discutida para el 
modelo Poisson, es cuando se observa en todos los puntos de un intervalo, pero las ocurrencias en 
los intervalos no son independientes. Decimos entonces que la Binomial Negativa es un modelo 
adecuado cuando se tiene contagio y, por extensión, que la distribución Binomial Negativa es una 
distribución de contagio. 


3. En los modelos Binomial e Hipergeométrico el interés se centra en las observaciones individuales y, por 
tanto, el parámetro de interés es la probabilidad de éxito en cada intento. En el modelo Poisson, y en 
el Binomial Negativo cuando se usa como modelo de contagio, lo que interesa es el número promedio 
de éxitos por intervalo y, en consecuencia, las repeticiones del experimento son el número de intervalos 
observados. 


4. La relación entre la media y la varianza en cada modelo es también ilustrativa. A continuación se resumen 
resultados obtenidos en secciones anteriores. 
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Variable aleatoria Media (u) Varianza (y?) Relación 
Binomial np npq u>o? 
Hipergeométrica np npq | u>o? 
Poisson À À ysg 
*Binomial Negativa m mem Ik u<o? 


*Se consideró la variable aleatoria N'= número de fracasos necesarios para obtener k éxitos. 


5. Derivando la distribución Binomial Negativa por otro método, y usando una generalización del símbolo 
de combinatoria, pueden admitirse valores fraccionarios para k. Es entonces cuando este modelo es 
más útil como modelo de contagio. En cualquier caso los resultados obtenidos son válidos. Nótese 
que mientras más pequeño sea el valor de k, mayor es la varianza en relación con la media. Por el 
contrario, si k crece, la varianza decrece aproximándose a la media. Cuando % es muy grande la función 
de probabilidades Binomial Negativa se aproxima a la Poisson. 


Cuando se usa la Binomial Negativa como modelo de contagio, a k se le llama el índice de agregación o 
índice de contagio. Si k es pequeño se dice que el contagio es fuerte. Si k es grande el contagio es débil y, 
para £ muy grande, se dice que no existe contagio y se usa la Poisson como modelo. 


Ejemplo 6.14. La distribución espacial de insectos en un campo de cultivo, es decir, el número de insectos por planta, 
por unidad de área o cualquier otro intervalo conveniente, puede representarse muy a menudo usando los modelos 
Binomial Negativo o Poisson. En la literatura abundan valores que van desde cerca de uno hasta 4 para el índice de 
agregación de diferentes especies de insectos. Una situación con fuerte contagio se tiene cuando la oviposición se 
realiza por masas de huevecillos y las larvas resultantes tienen poca movilidad. El índice $ será entonces pequeño. El 
caso contrario se tiene cuando la oviposición es individual. De lo anterior se desprende que el valor de k depende 
tanto de los hábitos del insecto como del tamaño del intervalo, vale decir del tamaño de la unidad de muestreo. 6 


6.9. La distribución Uniforme Continua 
La primera función de densidad para una variable aleatoria continua que presentamos es la llamada Uniforme 
Continua, la cual es un homólogo de la Uniforme Discreta que se estudió en la sección 6.2. De hecho, un caso 


particular de la Uniforme se presentó en el ejemplo 5.4, y aquí sólo la generalizaremos. 


Definición 6.7 (Función de densidad de probabilidades Uniforme). Se dice que una variable aleatoria X tiene 
una distribución Uniforme Continua si su función de densidad de probabilidades es: 


150, <x<0, 


fx (x)= 0, —0, 


0, de otra forma 


donde 0, y 0), son dos números reales tales que 0, < 0,. 6 
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La gráfica de la función tiene la siguiente forma. 


fx(x) 


0, 0, 
Figura 6.3. Gráfica de la Distribución Uniforme en el intervalo [0, —6,].. 


El segundo enunciado es claro de la Figura 6.3, ya que es obvio que si [a,b] y [c,d] son subconjuntos de 
[0,,0, ], entonces: 


PL a 


Pla<X<bl= 
Ñ 0,-0, 0,-0, 


Ejemplo 6.15. Sea X una variable aleatoria distribuida uniformemente en el intervalo [3,4]. Es decir, 
X ~ U[-3,4]. 


a) La función de densidad de X es: 


1 1 
fe(x)=34-—(-3) 7 FERRA 


0, de otra forma 
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b) La gráfica de la distribución es: 


fx(x) 


>9 0 4 


c) Enseguida se evalúan las probabilidades de algunos eventos. 
1. PR2<X<D=[1-(-2)01/7)=3/7=0.4286 
2. P(—1.5 < X <3.2)=[3.2-(-1.5)/1/7)=4.7/7=0.6714 
3. PAS X <6)=Pl s X <4]+P[4< X <6]=(4-1)(1/7)+0 =3/7 = 0.4286 
4. P(X e[-1,0]u[1,4])= P[-1< X <0]+ Pls X <4]=1/7+3/7 =4/7 =0.5714 


5. P(X>3)=P(3<X<4)+P(X>4)=1/7+0=0.1428 


6. P(X<0)=P(-3<X<0) +P(X<-3)=3/7+0=0.4286 


6.10. La distribución Normal 


Entre las funciones de densidad de variables aleatorias de tipo continuo destaca por su 
gran importancia la llamada Distribución Normal o Ley Normal de los Errores, de acuerdo 
con Carl Gauss (1777-1855), prominente matemático que intervino destacadamente 
en su desarrollo histórico. Esta distribución tiene gran importancia debido a que es 
un modelo adecuado para una gran diversidad de situaciones en el mundo real y 
también por su sobresaliente papel en la teoría estadística, puesto que sirve como 


punto de partida para el desarrollo de muchas técnicas de inferencia. Entre las 
Carl Gauss 
1777-1855 
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áreas de la ciencia donde ésta distribución ha sido más utilizada como modelo se pueden mencionar a la Física, la 
Astronomía, la Biología, la Agronomía, y la Medicina. 


Con objeto de orientar la discusión que seguirá, y de indicar el tipo de fenómenos que pueden ser representados 
8 y q 
por la Distribución Normal, presentamos enseguida una gráfica típica de la distribución. 


Figura 6.4. Gráfica de la Distribución Normal. 


La distribución es simétrica, continua y en forma de campana. Esto sugiere que los fenómenos en los que se 
va a usar la Normal como modelo deberán ser de tal naturaleza que los valores numéricos de los datos que se 
presentan con mayor frecuencia se concentren alrededor del valor esperado de X, y a medida que se alejan de 
él, su frecuencia disminuye. Dada esta gráfica, es fácil comprender por qué esta distribución se derivó como 
modelo para la distribución de frecuencias de los errores de medición, donde £ (X) es el valor verdadero de una 
constante que se desea determinar y x es una medición cualquiera. El error en una medición es x— E(X). Es 
razonable suponer que errores pequeños tienen una frecuencia alta, mientras que los errores muy grandes tienen 
una frecuencia baja. También es válido suponer que un error en cierto número de unidades por defecto sea tan 
frecuente como el mismo error en unidades por exceso; de allí la simetría de la distribución. 


Cabe recordar que, debido a que la distribución Normal es continua, solamente pueden calcularse probabilidades 
para intervalos en el espacio muestral de X, ya que para cualquier posible valor kde X, P(X = k) = 0. Asimismo 
debe recordarse que en cualquier función de densidad P(X = x) # fy (x). 


Definición 6.8 (Función de densidad Normal de probabilidades). Una variable aleatoria X se distribuye 
normalmente si su función de densidad es: 


l 


fx (x)= oda 


0, de otra forma 


Lata r} 
pr ;—0 <y <0 


donde u= E(X), —œ< u <%; Var(X)=0°, 0° >0; e=2.71828... y 1=3.14159... + 
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Con objeto de observar el efecto de diferentes valores de u y o” en la forma de la distribución, se presentan a 
continuación algunas situaciones ilustrativas. 


Mı > 


Figura 6.5. Funciones de densidad de dos variables normales con diferente media y la misma varianza (44, < 4). 


u 


Figura 6.6. Funciones de densidad de 3 variables normales con la misma media y diferentes varianzas (o? zg z a?) ; 
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De las Figuras 6.5 y 6.6 es evidente que cambios en los valores de 4 no alteran la forma de la distribución, 
pero sí afectan la posición de la curva en el eje de las abscisas, mientras que cambios en o° pueden modificar 
drásticamente la forma de la distribución pero no cambian la posición de la curva en el eje de las abscisas. Por lo 
anterior se dice que 4 es un parámetro de localización, mientras que 0? es un parámetro de escala o de dispersión. 


A continuación se anotan algunas propiedades de la distribución. 


La función de densidad de una variable aleatoria normal es complicada y, por tanto, es difícil calcular 
probabilidades en ella. Por añadidura considérese el problema de generar tablas para esos cálculos, teniendo 
en cuenta que se requeriría una tabla diferente para cada par de valores u y 0”. La solución a este problema 
es transformar estas probabilidades en probabilidades de un miembro particular de la familia Normal de 
densidades. Esta distribución particular recibe el nombre de Distribución Normal Estándar, y el proceso por el 
cual se obtiene se llama estandarización de una variable aleatoria. En efecto, considérese una variable aleatoria X 
con media Uyy varianza 0%, y defínase la variable aleatoria: 


z=% Hx 


La esperanza de Z es: 


Oy 


1 
= — — =0 
A (ux-ux) 


y la varianza de Z es: 


X- 1 1 F 
Var (2) = Var var X=) Va 
OX Tx Ox 


Oy 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 


Infante-Gil 


par 


y Zárate de Lara 
El caso de la normal estándar es de particular importancia, por lo que se presenta por separado. 


Definición 6.9 (Distribución Normal Estándar). Sea X una variable aleatoria distribuida N ( uo? i La variable 
aleatoria 


tiene distribución N (0, 1). Su función de densidad es: 


1 
frlz)= Jan 


0, de otra forma 


> 
2. _o<z<w 


+ 


La importancia de este miembro específico de la familia Normal de funciones de densidad estriba, como ya 
se dijo, en que probabilidades en cualquier miembro de la familia pueden calcularse en la Normal Estándar. 
Suponga que se quiere calcular la probabilidad de que X ~ N (uo?) se encuentre entre dos constantes 4 yb 
(a < b). Se tiene: 


Plas X <b)=P(a-usX-u<b-u) 


= p(T žE <t>) 
O 10 O 


-u 


Si en la última expresión notamos que tiene una distribución N (0, 1) y la denotamos por Z, tenemos: 


da. <z<*=) 
O O 


Pusxso=r| 


Aún así, el cálculo de probabilidades en la variable aleatoria Z no es fácil, por lo que en la tabla C se proporcionan 
estas probabilidades. En seguida se describe el uso de dicha tabla. 
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Uso de las tablas de la Distribución Normal Estándar 


La tabla C está integrada de la siguiente forma: la primera columna tiene valores de la variable Z de —3.6 a 
3.6 y la primera hilera, números que permiten obtener valores de Z con una decimal más. El resto del cuerpo 
de tabla contiene las probabilidades de que la variable aleatoria Z tome un valor menor o igual que el valor 
particular z que se desea, es decir, el área bajo la curva a la izquierda del valor z. Así, por ejemplo, si deseamos 
calcular P(Z <1.96), buscamos en la primera columna el número 1.9 y en la primera hilera el número 0.06. 
El número ubicado en la intersección de la hilera con el número 1.9 y la columna encabezada por 0.06 es la 
probabilidad buscada; en este caso ese número es 0.975 por lo que: 


P(Z <1.96)=0.975 


Enseguida se proporcionan algunas igualdades que simplifican el uso de la tabla C. 


Se ilustra ampliamente el cálculo de probabilidades en la normal estándar usando la tabla C. 
Ejemplo 6.16. En todos los casos de este ejemplo Z ~ N (0,1). 


a) Se desea encontrar P(Z<1.73) y P(Z 21.73). La primera probabilidad corresponde al área 
sombreada en la siguiente figura (área bajo la curva a la izquierda del número 1.73) y puede obtenerse 
directamente de la tabla C. Este número es 0.9582 y, por tanto, P(Z <1.73) = 0.9582. La segunda 
probabilidad pedida corresponde al área que no está sombreada en la figura. Puesto que el área total bajo 
la curva es uno, es claro que P(Z 21.73) = 1 — 0.9582 = 0.0418. Similarmente, usando la última 


igualdad en (6.20) obtenemos directamente de la tabla P(Z >1.73) = P(Z <-—1.73) = 0.0418. 
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0.9582 


0.0418 


1.73 


b) Calcular la probabilidad de que Z se encuentre entre —0.17 y 1.82. Es decir, P(-0.17 < Z <1.82). 
Usando la expresión (6.21) se obtiene: 


P(-0.17 < Z <1.82)= P(Z <1.82)-P(Z <-0.17) 
= 0.9656 — 0.4325 = 0.5331 


La probabilidad corresponde al área sombreada en la siguiente figura. 


0.5331 


—0.17 1.82 


c) Calcular P(—3.6 < Z < 3.6) 
Usando (6.22) obtenemos: 


P(—3.6 £ Z <3.6)=1—2P(Z <-3.6) 
= 1 — 2(0.0002) = 0.9996 


a 
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La probabilidad obtenida corresponde al área bajo sombreada en la siguiente figura: 


0.9996 


3.6 3.6 
d) Encontrar P(Z <—1.4 o Z > 2.8). Dado que: 


{z|z < —1.4}N {z 2 2.8} = ġ, 


tenemos que: 


P(Z <—1.4 0o Z 22.8)= P(Z <—1.4)+ P(Z 22.8) 
= P(Z <-1.4+P(Z <-2.8) 
= 0.0808 + 0.0026 = 0.0834 


Estas probabilidades se muestran en la siguiente figura. 


0.0808 
0.0026 
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e) Se desea encontrar el valor de z tal que P(Z > z) = 0.4602. El valor de z que se busca es aquél cuya área 
a su derecha es 0.4602, tal como se muestra en la figura. 


Puesto que el área bajo la curva es uno, el área no sombreada debe valer 0.5398, es decir, 
P(Z <z)=0.53%8. 


En la tabla C encontramos que la probabilidad acumulada 0.5398 corresponde a una z de 0.1, o sea que 
P(Z <0.1) = 0.5398, por lo que el valor buscado es 0.1. 


f) Se quiere obtener el valor de z (z > 0) tal que Pl=z<Z<z)=0.8. 
Usando la igualdad (6.22) se tiene: 


0.8=P(=z2<Z<z)=1-2P(Z <-z) 


De donde: 


P(Z<-z)=0.1 


De la tabla C se obtiene —z = — 1.28, por lo que el valor buscado es z = 1.28. 
+ 


Una vez que se ha ilustrado casi exhaustivamente el uso de la tabla C para el cálculo de probabilidades de la 
Normal Estándar, ejemplificamos su uso para el cálculo de probabilidades en cualquier miembro de la familia 
normal de densidades. Todos los ejemplos son aplicaciones simples de la propiedad (6.19). 


Ejemplo 6.17. Sea X una variable aleatoria distribuida N (50, 100). Queremos encontrar P(X < 30). 


=s 0— 
P(X <30)= pps zł =] =P(Z<-2)=0.0228 + 
O 
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Ejemplo 6.18. Si X ~ V(1,16) ¿cuál es la probabilidad de que X esté entre —3.1 y 9.2? 


P(=3.1<X<9.2)= nm AS E 


= P(-1.025<Z <2.05)= P(Z < 2.05) 
=P(Z <-1.025)=0.9798-0.1527 = 0.8271 ® 


Ejemplo 6.19. Si el tiempo (en segundos) que una bacteria resiste a determinado antibiótico se distribuye N 
11200, 14 400), ¿cuál es la proporción de bacterias que resisten más de 1000 segundos? 


Sea X la variable tiempo, entonces: 


=] 
Px =1000)= p(z 2 000-1200 


=]1— P(Z <—1.67)=1—0.0475 = 0.9525 


]=2(Z=-1.67) 


La respuesta es entonces el 95.25%. 6 


6.11. La distribución Ji-cuadrada 


En esta sección se estudiará una distribución probabilística que juega un papel muy importante en la derivación 
de una gran cantidad de métodos estadísticos. Esta distribución, llamada /i-Cuadrada, surge como la suma de 
cuadrados de variables aleatorias independientes Z,, cada una con distribución normal estándar. El caso más 
sencillo se tiene cuando se considera una sola variable aleatoria normal estándar elevada al cuadrado. Esto es, si 


Z ~ N (0,1), entonces: 
xX =Z 


se distribuye como una variable aleatoria con función de densidad Ji-cuadrada, la cual obviamente sólo puede 
tomar valores no negativos. No presentaremos aquí la función de densidad de una variable aleatoria Ji-cuadrada, 
sólo diremos que la forma de la distribución depende del número de variables normales independientes 
involucradas. Si se tienen v variables normales independientes, entonces definiendo: 


K= Z? +Z? ++ 


decimos que %3 tiene una distribución Ji-cuadrada con v grados de libertad. La forma de la distribución depende 
exclusivamente de los grados de libertad, es decir, del número de variables aleatorias normales independientes que 
la generan. El parámetro de la distribución son los grados de libertad. Si una variable aleatoria W se distribuye 
como X? conv grados de libertad, usaremos la notación W ~ TAR 


En la Figura 6.7 se presentan gráficas de distribuciones Ji-cuadrada con diferentes grados de libertad. 


g: 
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Figura 6.7. Formas de la distribución z? con diferentes grados de libertad. 


En la Figura 6.7 puede observarse que, a medida que v aumenta, la media y la varianza de la distribución 
aumentan. De hecho las expresiones para la media y la varianza son funciones crecientes de los grados de 
libertad, según se establece enseguida. 


De la Figura 6.7 también puede observarse que, a medida que v aumenta, la asimetría de la distribución disminuye. 
Puede probarse que la distribución Z? se aproxima a la Normal cuando se tienen muchos grados de libertad. 
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Como ya se dijo, no se presentará en este libro la función de densidad de la distribución Ji-cuadrada. El cálculo 
de probabilidades se hará mediante la tabla D. 


Uso de las tablas de Ji-cuadrada 
La tabla D está integrada de la siguiente forma: en la primera columna se encuentran los grados de libertad vy, en 


la primera hilera diferentes valores æ de probabilidad, y en el resto de la tabla valores de la variable, denotados 
por %4 (v), tales que: 


PY 2 0) = 


2 . . . . / . 
esto es, %4 (v) es aquel valor de la variable aleatoria Ji-cuadrada con v grados de libertad tal que el área bajo la 
curva a su derecha es æ. Lo anterior se ilustra con la siguiente figura. 


2 
Xi) 


Figura 6.8. Área que determina el valor de y7 (v). 


El lector debe notar que cada hilera de la tabla sólo da la probabilidad a la derecha de algunos valores %4 (v). Esto 
se debe a que en este caso no es posible transformar las probabilidades a una Z” con Y arbitraria a probabilidades 
de un miembro particular de la familia de densidades Y, tal como se hizo en el caso de la Normal. La tabla que 
se presenta es entonces muy incompleta, pero suficiente para nuestros propósitos. En los siguientes ejemplos se 
ilustra el uso de la tabla. 


Ejemplo 6.20. En la distribución de Ji-cuadrada con 15 grados de liberad se desea encontrar eL valor de la 
variable tal que la probabilidad de un valor mayor o igual sea 0.05, es decir, se desea obtener %205(15). En 
símbolos %6 o5(15) es tal que: 


2 


Plia 2 Xb.05(15)) = 0.05 


mn 
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En la primera columna se busca v = 15, y en la primera hilera el valor æ = 0.05. En la intersección de esa hilera 
y esa columna leemos el número 24.9958; por tanto: 


P(xÍ5) > 24.9958) = 0.05 


En la siguiente figura se ilustra la situación descrita: 


0.05 


2 Xis) 
Xú.0s (15) = 24.9958 ! 


De la figura, es claro que si se desea una æ menor que 0.05, el valor requerido será mayor. Por ejemplo, el valor 


Xe a05) es 30.5779. 


Ejemplo 6.21. En este ejemplo se propone el problema inverso. Dado un valor de X?, se desea encontrar la 
probabilidad de un valor mayor. El lector debe notar que esto no siempre es posible, dado que la tabla D es 
incompleta. En este caso, con propósito ilustrativo, se elige un valor que sí aparece en la tabla. Con v = 10 se 
desea encontrar la probabilidad de que la variable Xx? sea mayor que 3.9403. En la primera columna se busca 
el valor v = 10, y sobre esa hilera se localiza el valor 3.9403. En la columna donde se encuentra este valor se lee 
a = 0.95, por lo que: 


P(xÍ0) > 3.9403) = 0.95 


Para finalizar esta sección consideremos de nuevo el caso con el que la iniciamos, esto es, el de una variable 

aleatoria Ji-cuadrada con un grado de libertad. La distribución se relaciona directamente con la de una normal 

estándar, de modo que es posible calcular las probabilidades en una de ellas a partir de la otra. Por ejemplo, 
2 o 2 ; 

Plz, > 0.455) =0.5. Puesto que por definición X(,, = Z”, esto es equivalente a: 


P(x% 20.455) =P (2? >0.455) =P (| Z |» /0.455)=0,5 


ME 
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De donde: 
P(-0.674< Z <0.674)=1-0.5 


Que esto es cierto, es fácil de verificar de la tabla C. En efecto: 


P(-0.674< Z <0.674) = P(Z <0.674)-P(Z <-—0.674) 
= 0.7500 — 0.2500 = 0.5000 


Debe observarse que la probabilidad encontrada (0.5000) corresponde a la suma de dos áreas iguales en la 
Normal, P(Z = 0.674) y P(Z <-—0.674). Esto se debe a que al elevar al cuadrado la variable Z todos los 
valores se vuelven positivos, concentrándose toda la probabilidad en la cola derecha de la %° resultante. Esto 
puede verse gráficamente en la Figura 6.9. 


En la Figura 6.9 se ha usado la notación Zą/2 en la normal, con la misma lógica que se usó en la x. Es decir, 
para cualquier Ẹ € (0,1), zę es tal que: 


sólo que en este caso, por la simetría de la distribución alrededor de cero, se tiene que el número que deja 
probabilidad £ a la izquierda, es decir 2,_¿, cumple con la igualdad: 


—Zan Za 


2 
12 Lal) 


e a 5 2 
Figura 6.9. Transformación de una normal estándar a una Xí;) - 


6.12. La distribución t de Student 


Una de las distribuciones con mayor uso en el análisis de datos provenientes de experimentos científicos 
es la llamada 1 de Student. Esta distribución fue descubierta por William Sealy Gosset (1876-1937), y debe 


«EY 
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su nombre al hecho de que Gosset publicó varios artículos bajo el seudónimo 
de Student. La distribución ż es simétrica, con media cero y de forma muy 
semejante a la normal estándar. Surge de la manera que se establece en la 
siguiente definición. 


Definición 6.10 (Distribución de Student). Si Z es una variable N (0, 1), y si 
> e Xi y) y es independiente de Z, entonces la variable aleatoria definida por 


e 
x Iv 


tiene una distribución + de Student con v grados de libertad. ® 


William Sealy Gosset 
1876-1937 


La distribución ż, según se dijo, tiene una apariencia similar a la de la Normal estándar y, de hecho, se 
aproxima cada vez más a ésta a medida que se tienen más grados de libertad. La principal diferencia entre 
ambas es que la distribución de ż tiene más área en las colas que la N (0, 1), tal como se muestra en la siguiente 
figura. 


Figura 6.10. Distribuciones N (0, 1) y ts). 


Capítulo 6 
ALGUNOS MODELOS PROBABILÍSTICOS IMPORTANTES 


Para calcular probabilidades en la distribución de ż se presenta la tabla E, cuyo uso se explica enseguida. 
Uso de la tabla de t 


En la primera columna de la tabla E se encuentran diferentes valores de los grados de libertad, mientras que en 
la primera hilera aparecen valores æ de la variable +, denotados por tą(V), tales que: 


Pl+>+,(v))=a 
Aquí, al igual que en la normal, debido a la simetría de la distribución se cumple que: 
P(t >t, (v))= P(t <-t, (vw) =a 


Para localizar un valor específico de 1,¿¿(V), se encuentra la hilera con grados de libertad v y sobre esa hilera 
la columna con la probabilidad æ deseada. El valor que aparece en el cruce de esa hilera y esa columna es 
ta(v). 


Ejemplo 6.22. Se desea encontrar el valor de + con 14 grados de libertad, tal que la probabilidad de un 
valor mayor es 0.05. Esto es, se desea encontrar £p05(14). En la tabla E se localiza la hilera con v = 14 y 
se busca el valor que aparece en el cruce de esa hilera y la columna con & = 0.05, el cual resulta ser 1.761. 
O sea que: 


P(ta4 21.761) =0.05 š 


Ejemplo 6.23. En la distribución de £ con 30 grados de libertad se desea encontrar los valores to.o25(30) y 
—£0.025(30). Es decir, valores tales que: 


P[—t0.025(30) £ t30 E 10.075(30)] = 0.95 


De la tabla E obtenemos: 


P(t; =2.042)=0.025 
De donde los valores buscados son 2.042 y — 2.042, esto es, 
P[-2.042 < t; < 2.042] = 0.95 


Esto se ilustra enseguida. 
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0.025 0.025 


£30) 


2.042 2.042 


Enseguida se ilustra cómo se aproximan la distribución Normal estándar y la + de Student cuando los grados de 
libertad para ésta aumentan. 


Ejemplo 6.24. En una distribución Normal Estándar el valor zp y es, de la tabla C, 1.28. Con 15 grados de 
libertad, el valor %, 19 es 1.341, mientras que con 30 grados de libertad se encuentra t ¡y y con 60 grados de libertad 
to.10 (60) = 1.296. Aquí se observa claramente cómo la diferencia entre las dos distribuciones disminuye cuando 
los grados de libertad para ż aumentan. 6 


6.13. La distribución F 


En diversos problemas de inferencia que se discutirán posteriormente, tales como comparar las varianzas de dos 
poblaciones normales, comparar los efectos de dos o más tratamientos, y otros muchos, es útil la función de 
densidad de probabilidades conocida como distribución de F. Su definición formal se da enseguida. 


A Sa 2 2 2 i P r do de 
Definición 6.11 (Distribución de F ). Sean Xim) y Xin) dos variables aleatorias independientes distribuidas 
como Ji-cuadrada con 7 y n grados de libertad, respectivamente. Entonces, la variable aleatoria F definida como 


_ Xom Im 


F 
Xin) In 


tiene la distribución F con m y n grados de libertad. 6 


La forma de la distribución se ilustra en la siguiente figura. 


qa 
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Figura 6.11. Distribución de F. 


La distribución F está ligada con la distribución + de Student, como se asienta a continuación. 


La expresión matemática para la función de densidad de Fes complicada, por lo que al igual que en el caso de 
las distribuciones Ji-cuadrada y ż de Student se proporcionan tablas para el cálculo de probabilidades en esta 
distribución. 


Uso de las tablas de F 


Las tablas F, G, H e I están integradas de la siguiente forma: la primera hilera tiene los grados de libertad (72) 
de la variable e en el numerador, mientras que en la primera columna están los grados de libertad (1) de la 
variable 7 en el denominador. El resto del cuerpo de la tabla presenta valores de la variable F tales que: 


La tabla F proporciona valores de EJ, para æ = 0.10, la tabla G para a = 0.05, la tabla H para a = 0.025, y 
la tabla I para a = 0.01. 


Ejemplo 6.25. Se quiere encontrar A? 705, es decir, el valor de F tal que la probabilidad de un valor mayor es 
0.05, con 4 y 15 grados de libertad. De la tabla G leemos, en la intersección de la columna con m = á y la hilera 
con n = 15, el valor 3.0556. Por tanto, PAN Es decir, 


E 
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P(F3>3.0556)=0.05 4 


De la definición de la distribución de F se deduce fácilmente la siguiente propiedad. 
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Ejercicios 


6.1. 


6.2. 


6.3. 


6.4. 


Suponga que en una urna hemos colocado 4 fichas idénticas excepto por el color. Las fichas son de 
color amarillo (A), verde (V), blanco (B) y rojo (R). Realizamos el experimento consistente en hacer 
que un niño elija una ficha al azar. De acuerdo con el resultado del experimento se le entregarán al 
niño tantos pesos como letras tenga el color de la ficha elegida. Defina la variable aleatoria X como el 
número de pesos recibidos por el niño. 


a) Encuentre la función de probabilidades de X. 

? 
b) Calcule uyy O%. 
c) ¿Qué valor tiene el parámetro de la distribución? 
Considere el experimento consistente en elegir un número al azar del directorio telefónico y registrar 
el último dígito del número en cuestión. Suponga que los diez dígitos tienen la misma frecuencia 
relativa. Defina la variable aleatoria X como: X = dígito obtenido + 1. 
a) Encuentre la función de probabilidades de X. 
b) Calcule E(X) y Var(X). 
De acuerdo con el X censo general de población de 1970, 96% de los mexicanos profesa la religión 
católica. Si elegimos una cédula censal al azar y definimos el resultado como éxito (E) si corresponde 
a un católico y como fracaso (F ) en caso contrario: 


a) ¿Qué modelo probabilístico es el adecuado? 


b) Sea X(F)=0 y X (E) =1. Encuentre la función de probabilidades de la variable aleatoria X. 
Calcule E(X) y Var(X). 


c) Suponga ahora que consideramos como resultados posibles del experimento las 5 categorías 
previstas en el censo. (Católica, Protestante o Evangélica, Israelita, Otra, Ninguna). ¿Se aplicaría el 
mismo modelo que en el inciso 4)? ¿Porqué? 


Refiriéndonos al ejercicio 6.3 suponga que se eligen tres cédulas independientemente, cuidando que 
las probabilidades de éxito sean iguales en las tres repeticiones. 


a) Escriba el espacio muestral en términos de éxitos y fracasos, y calcule las probabilidades de cada uno 
de los ocho eventos resultantes (use seis decimales). 


c) ¿Cuál es la probabilidad de que la primera cédula correspondiente a un católico sea la segunda que 
se elige? ¿De que la primera cédula corresponda a alguien que no es católico? 
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c) Sea el número de católicos en la muestra. Encuentre fy (x) directamente del espacio muestral. 
Obtenga una ecuación para fy (x) y evalúe en ella las probabilidades. 


6.5. Evalúe las siguientes expresiones: 


> os 
>) os) 
do os 
o o (5) 


6.6. En el ejercicio 6.4 calcule 4 y y o% directamente de las definiciones de esperanza y varianza. Verifique 
sus cálculos mediante las ecuaciones (6.5) y (6.6). 


6.7. Si X ~ Bin(7,0.4): 


a) Calcule, directamente dela función, lassiguientes probabilidades: P(X < 2), P(X > 4), P(X =5) 


b) Verifique sus cálculos usando la tabla A. 


6.8. Use la tabla A para calcular: 
a) P(X < 4), P(X >10) y P(8< X <11), si X ~ Bin(18,0.8) 
b) P(X 26), P(X <2) y P(3< X <5), si X ~ Bin(8,0.55) 


c) P(X < 4), P(X =3), si X ~ Bin(6,0.1) 
6.9. Calcule media y varianza en la función del ejercicio 6.7. 


6.10. Verifique las probabilidades de las distribuciones binomiales en el ejemplo 6.6. Calcule la mediana en 
cada una de ellas. 


n n 
6.11. Demuestre que | | = | 
E 


n—x 
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6.12. Suponga que dos equipos (A y B) van a disputar una serie de 4 juegos. En cada juego sólo hay dos 


6.13. 


resultados posibles: gana A o gana B. En el primer juego ambos equipos tienen la misma probabilidad 
(0.5) de ganar, pero a partir del segundo el equipo que ganó el juego anterior aumenta en 0.1 su 
probabilidad de ganar un juego dado en relación con la que tenía en el precedente. Por ejemplo, la 
secuencia de triunfos ABAA tiene probabilidad: (0.5) (0.4) (0.5) (0.6). 

a) Escriba el espacio muestral y calcule la probabilidad de cada evento. 

b) ¿Qué suposición del modelo Binomial no se cumple aquí? 

c) Sea Xel número de juegos ganados por el equipo A. Obtenga fy (x) para los valores posibles de X. 
d) ¿Cuál es la probabilidad de que el equipo que gana el primer juego gane la serie? (tres o más juegos) 
e) Repita los incisos c) y d) suponiendo que X ~ Bin(4,0.5). Compare resultados. 

De acuerdo con un reporte (Science, julio 25, 1952. pág. 74), el 53% de estudiantes con un año de 
estudios universitarios que presentaron un examen lo aprobaron. Suponga que se toma una muestra 


de tamaño 8 de esa población. 


a) ¿Cuál es la probabilidad de que encontremos 6 o más individuos que hayan aprobado el examen? 
¿Exactamente 5? (el número de estudiantes en la población es de 97 800). 


b) De 77 000 estudiantes de tercer año que presentaron el mismo examen, el 71 % lo aprobaron. Para 
este grupo conteste las mismas preguntas que para el primero. 


c) Dibuje los histogramas de probabilidades para las dos distribuciones. 


6.14. Un inspector sanitario tiene a su cargo la vigilancia de 15 plantas pasteurizadoras de leche. Cada día visita 


6.15. 


5 de ellas, elegidas al azar, para detectar violaciones al código sanitario. Suponga que en un día dado 6 
de las 15 pasteurizadoras han infringido el código. Sea X el número de plantas infractoras en la muestra. 


a) ¿Qué modelo probabilístico es adecuado para X ? Úselo para evaluar las probabilidades de los 
posibles valores de X. 


2 . e_o . . z . 
b) Calcule 4y y g% directamente de las definiciones respectivas. Verifique sus cálculos mediante las 
ecuaciones presentadas para el modelo. 


c) Proceda ahora como si las 5 repeticiones del experimento fueran independientes. Evalúe bajo este 
supuesto las probabilidades y calcule uyy 0%. 


Refiriéndonos al ejercicio 6.14, suponga ahora que las pasteurizadoras al cuidado del inspector son 60, 
pero por limitaciones de tiempo sólo visita 5 diariamente. Suponga además que en un día dado hay 
24 plantas infractoras. Es decir, que el tamaño de la población ha aumentado, pero la proporción de 
infractores es la misma que antes. 
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EL. 


6.16. 


6.17. 


6.18. 


6.19, 


a) Repita a), b) y c) del ejercicio 6.14. Compare resultados. 


b) Calcule el “factor de corrección por finitud de la población” en cada caso y compárelos. 


Un profesor de matemáticas en una escuela de enseñanza media ha reportado al director que sólo 4 
de sus 20 alumnos no saben construir el triángulo de Pascal. El director, un tanto escéptico, decide 
interrogar a los 20 estudiantes, pero debe interrumpir el experimento cuando ha examinado a cuatro. 
Suponga que ninguno de 4 ha sido capaz de responder. ¿Cuál es la probabilidad del resultado obtenido 
si el reporte del profesor es correcto? 


El mismo director del ejercicio 6.16 decide realizar un experimento con la 
clase de literatura española, en la cual hay 17 alumnos. El experimento 
consiste en preguntar a 9 estudiantes elegidos al azar si saben quién 
es el autor del clásico soneto que empieza con la línea “Un soneto 
me manda hacer Violante”. Suponga que siete de los estudiantes lo 
ignoran. Sea X el número de estudiantes en la muestra que no da la 
respuesta correcta. 


a) Encuentre fy (x) y evalúela. 


b) Note que 5 fx (x) =1. Esto implica que fy(8)= f,(9)=0. 
x=0 
¿Por qué? 
c) Calcule P(X 2 6). Félix e 


2 . 
d) Calcule uy, o% y la mediana de X. 
e) ¿Quién es el autor del soneto? 
Suponga que el número de terremotos (X) por mes en la ciudad de México sigue una distribución de 
Poisson con Å = 0.2. 


a) Escriba fy (x). Evalúela para x = 0, 1, 2,..., pero únicamente mientras fy (x) = 0.000005 y 
redondee a 5 decimales. 


b) Con las probabilidades del inciso a) calcule uyy 0%. Verifique sus cálculos con las ecuaciones dadas 
en la sección 6.6. Calcule la mediana de X. 


c) ¿Cuál es la probabilidad de que en un mes ocurran dos o más terremotos? ¿Exactamente uno? 


Use la tabla B para calcular las siguientes probabilidades: 
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a) P(X<3);P(3<X<5)POQS<X<4);P(3<X<5), cuando X ~ P(3). 
b) P(X >6); P(X <4); P(9< X <15), cuando X ~ P(9). 


c) Las mismas probabilidades del inciso b) si X ~ P(6). 
6.20. Verifique por cálculo directo las probabilidades del inciso $) en el ejercicio 6.19. 


6.21. Usando sus cálculos en el ejercicio 6.18 y la tabla B, dibuje los histogramas de probabilidades de P(0.2) 
y P(3). Observe la asimetría en cada caso. 


6.22. Suponga que X ~ P(4). Si fx(1)= fy(2). ¿cuál es el valor de 2? 


6.23. En el ejercicio 6.3 se asentó que sólo 4 % de los habitantes de la República Mexicana no profesan la 
religión católica. Suponga que tomamos una muestra de tamaño 85 y definimos la variable aleatoria 
X como el número de personas en la muestra que no son católicos. 


a) Compare los valores de fy (x) para x = 0,1,2,..., 13, usando los modelos Binomial y Poisson. 
b) Calcule P(X < 4) y P(X > 6) con los dos modelos. 

6.24. Para un experimento médico se requieren 5 mujeres que hayan tenido 6 o más partos. La proporción 
de mujeres adultas con esa característica en México es 0.25. (IX Censo General de Población). Suponga 
que se toma una muestra de mujeres adultas. Sea Nel número de mujeres que es necesario entrevistar 
para encontrar las cinco buscadas. 


a) ¿Cuál es el modelo apropiado para la distribución de N? Escriba fy (7). 


b) ¿Cuál es la probabilidad de que en 10 o menos intentos se encuentren las cinco mujeres? ¿De que 
se requieran más de 20 intentos? 


c) Calcule media, mediana y desviación estándar de N. 
6.25. En el ejercicio 6.24 suponga ahora que las 5 mujeres deben haber tenido dos o más partos. La 
proporción de mujeres adultas con esta característica es 0.5. 


a) Conteste las mismas preguntas que en 6.24 b. Conserve 5 decimales y calcule las probabilidades 
mientras fy (x) = 0.000005. Compare sus resultados con los de 6.24 b. Interprete los cambios. 


b) De las probabilidades obtenidas calcule 4 yy 0). Compare sus resultados con los obtenidos usando 
las ecuaciones (6.11) y (6.12). ¿A qué se deben las discrepancias? 
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6.26. 


6.28. 


6:29. 


Suponga que se realizan repeticiones independientes de un experimento Bernoulli (con p = 0.9) hasta 
que se obtienen dos éxitos. (En todo el ejercicio conserve seis decimales). 


a) Sea N el número de intentos necesarios para que el experimento termine. Encuentre fy (1). 
2 
Calcule uyy Ty. 


b) Sea N' el número de fracasos antes de obtener dos éxitos. Encuentre fy:(n'), donde 
N'= N-2. Evalúela. Calcule Uy» y 0)», directamente de las probabilidades y usando las 
ecuaciones (6.13) y (6.14). 


c) Verifique que E(N’) = E(N)-k y Var(N')=Var(N). 


. Un ladrón vigila una residencia por las noches con objeto de intentar un robo. Ha decidido intentarlo 


la primera vez que el habitante de la casa salga después de las nueve de la noche. Suponga que la 

probabilidad de que esto ocurra es 0.6 para cada día y es idéntica para todos los días. Suponga además 

independencia. 

a) ¿Cuál es la probabilidad de que el ladrón tarde más de 4 días en intentar el robo? 

b) Sea N el número de días que el ladrón vigila la residencia. (incluido el día del robo.) Encuentre 
fy (n) Uy, MAN) y ON. 

Si X-U[-2,3]. 

a) Grafique la función de densidad. 


b) Calcule las siguientes probabilidades: P(X > 1), P(X <2), P(-1<X<1.5), P(X > 4), 
P(X s-1.5). 


c) Calcule 4y, 0% y MAX). 


Con respecto a la función que se grafica en seguida: 


fx(x) 


=ð 0 


a) Escriba fy (x) 
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b) Calcule E(X) y M,.(X) 
c) Encuentre Var(X) en términos de 6. Evalúela para O = 2 


d) Encuentre Fy (x) en términos de 0. Grafíquela para 0 = 2 


6.30. Considere la siguiente función de probabilidades: 


— Hy 


X 
Defina la variable estandarizada Z = 


y obtenga su función de probabilidades. Úsela para 
2 X 
verificar que 47 =0y 07 =1 


6.31. Sea Z una variable aleatoria normal estándar. Usando la tabla C encuentre: 


a) P(Z <O0) f) P(Z > —0.49) 

b) P(Z <-—0.28) g) P(Z <2.14) 

c) P(Z <0.28) h) P(0.31< Z <0.78) 

d) P(Z<0.51) i) P(-2.03< Z <-1.27) 
e) P(Z >-—0.49) j) P077<Z 5103) 


6.32. Si Z ~ N(0,1), encuentre en cada caso el valor de c que satisfaga la ecuación. 


a) P(Z<c)=0.1131 f) P(0<Z<c)=0.0199 
b) P(Z>c)=0.8869 g) P(c<Z<0)=0.4981 
c) P(Z>c)=0.0073 h) Pl=c<Z<c)=0.7154 
d) P(Z>c)=0.5000 i) P(—c< Z < c)= 0.2434 
e) P(Z<c)=0.9370 j) P(—c < Z < c) = 0.0802 


6.33. Sea Z una variable aleatoria N (0,1). Sea F(z) su función de distribución acumulativa de 
probabilidades. Usando la tabla C obtenga suficientes valores de Fz (z) para graficarla uniendo los 
puntos con una línea continua. 


6.34. Si X ~ N(60,81) calcule: 


Ed 
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a) P(X <80) d) P(62 < X < 69) 
b) P(X <50) e) P(41 < X < 49) 
c) P(50 < X <70) 


6.35. Suponga ahora que X ~ N(60,16). Calcule las mismas probabilidades que en 6.34. Compárelas e 
interprete los cambios en relación con la disminución de g 


6.36. Si X ~ N(10,4), encuentre c en cada caso. 


a) P(X<c)=0.5596 d) P(X >c)=0.0055 
b) P(X<c)=0.1762 e) Pl=e<X-—u<c)=0.1896 
c) P(X>c)=0.5478 


6.37. En una planta empacadora de camarón se separa el producto en seis calidades de acuerdo con el peso 
del crustáceo, como sigue: 


Calidad Peso por pieza (gramos) 
A más de 30 
25 a 30 
20a25 
16a 20 
13a16 


menos de 13 


es M: E > BE e E) 


Suponga que el peso del camarón en el área de abasto de la planta puede modelarse mediante una 
Normal con media de 22 gramos y desviación estándar de 6 gramos. Calcule los porcentajes de cajas 
de cada calidad que produce la planta. 


6.38. En un artículo (Science, septiembre 26, 1952, pág. 311) se reporta que el 10% de los universitarios 
graduados que presentan cierto examen obtienen una calificación de 112 o menor, y que el 10% 
obtienen 140 puntos o más. Suponga que esas frecuencias relativas pueden tomarse como probabilidades 
y que la distribución de calificaciones puede modelarse mediante una distribución Normal. Encuentre 
la media y la varianza de dicha distribución. 


6.39. El examen del ejercicio 6.38 es una prueba de aptitudes para el ejército. Suponga que los examinados 
que obtienen calificaciones en el 40% superior de la distribución son reclutados como oficiales. ¿Cuál 
es la calificación mínima necesaria para ingresar como oficial? 
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6.40. En las distribuciones Ji-cuadrada que siguen encuentre los valores de que satisfacen las igualdades. 


6.41. 


6.42. 


6.43. 


6.44. 


6.45. 


a) Pa > c)=0.01, para v=4,v=10,v=20yv=30 
b) plz >c)=0.005 , para v=4,v=10,v=20yv=30 
( ) =0.025, para v=6,v=15yv=25 


d) P(y? <c)=0.05, para v=6,v=15 yv=25 


En las distribuciones ż de Student que siguen encuentre los valores de c que satisfacen las igualdades. 


a) P(t, 20)=0.25, para v=1,v=5,v=10,v=20,v=40,v=60 y v=120 


b) P(t, >c)=0.005, para v=1,v=5,v=10,v=20 yv=40 


c) P(t, <c)=0.025, para v=4,v=12,v=18, y v=29 


En una distribución de £ con 11 grados de libertad encuentre c tal que: 


P(—c $ ti) < c) = 0.99 


Compare los valores obtenidos en el inciso a) de 6.41 con los que se obtienen de una N (0,1). Comente. 


En las distribuciones de F que siguen encuentre los valores de c que satisfacen las igualdades. 


a) P(E” >c)=0.05; para m=3,n=23m=8,n=8;m=15,n=13;m=20,n=24. 


b) p(E” > c)=0.10; para m=5,n=43m=10,n=10;m=12,n=22. 


De la tabla G obtenga Ezo.95, es decir, el valor de c tal que: 
P(FÈ >c)=0.95 


o lo que es lo mismo, tal que: 


P(E%<c)=0.05 


1 
(Pista: Aunque ese valor no aparece en la tabla, puede obtenerse a partir de ella. Si X ~ E - En.) 


m 
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6.46. Sean Z,,Z>,... Z, variables aleatorias independientes, cada una con distribución N (0,1). Sea 
1 2 1 
2 2 2 2 ' > 
Xy = Ll +Z +++ Z. Use propiedades de la esperanza matemática para probar que la esperanza 


de una variable aleatoria Ji-cuadrada es igual a sus grados de libertad. Es decir, pruebe que: 


C pítulo va se 


cosas que, como dl 


Distribuciones derivadas del muestreo 


7.1. Muestra de variables aleatorias 


En el capítulo 4 se definió a una muestra como “el conjunto de resultados que se recolectan de hecho en una 
investigación”. Una vez que se han estudiado en los capítulos 5 y 6 las distribuciones de variables aleatorias y 
algunos modelos probabilísticos importantes, es tiempo de volver a la definición dada, con objeto de ampliarla 
y derivar algunos resultados importantes en conexión con ella. Esto es necesario como última etapa en nuestra 
tarea de acumular las herramientas requeridas para inferir sobre una población a partir de una muestra. Los 
métodos inductivos de la estadística se presentan formalmente a partir del capítulo 8. 


La definición de muestra que tenemos se inscribe naturalmente en el contexto de un experimento aleatorio 
y repeticiones del mismo. En efecto, para obtener los datos en una investigación realizamos repeticiones de 
un experimento aleatorio, teniendo un espacio muestral para cada repetición. Si en cada uno de esos espacios 
muestrales definimos una variable aleatoria, tendremos que la colección de variables aleatorias así definidas 
constituyen lo que llamaremos una muestra. Aquí es necesario hacer una distinción muy importante. La idea 
de muestra como un conjunto de variables aleatorias es un concepto teórico, necesario para derivar algunos 
resultados importantes. Los números sobre los que operan los métodos estadísticos son los valores específicos 
que toman estas variables aleatorias, una vez que se han realizado las repeticiones del experimento. Así, si 
se consideran 4 repeticiones independientes de un experimento Bernoulli antes de realizar físicamente el 
experimento, se tienen variables aleatorias X}, X>» Xz, y Xy cada una de las cuales puede tomar los valores cero 
o uno. Si se efectúan las 4 repeticiones y se obtienen, por ejemplo, los valores 0, 1, 1, 0, ya no puede hablarse 
de variables aleatorias sino de observaciones (o realizaciones) de variables aleatorias. Toda la discusión anterior 


se ilustra enseguida. 


Ejemplo 7.1. Un extensionista agrícola desea investigar el número de veces por año que los agricultores de una 
cierta comunidad acuden a la oficina local de extensión agrícola a solicitar asesoría técnica. Supongamos que el 
número de agricultores en la localidad es de 20 000, y definamos la variable aleatoria X como el número de veces 
que un agricultor acude a solicitar asesoría. Supongamos también que la distribución teórica de X, desconocida 


para el investigador, es la siguiente: 
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El extensionista está interesado en tomar una muestra de agricultores que le proporcione información sobre 
la función de probabilidades de X, y con ese propósito entrevista a 40 agricultores y registra el número de 
consultas por año de cada uno de ellos. Antes de realizar las entrevistas tiene las variables aleatorias X}, X,..., 
Xio cada una de las cuales puede tomar los valores 0, 1, 2, 3. Ahora bien, la muestra se elige mediante el 
siguiente procedimiento. A cada agricultor se le asigna un número entre 1 y 20 000, y después se selecciona un 
primer número de acuerdo con un modelo probabilístico Uniforme Discreto. El número así elegido identifica 
a un agricultor, al cual se le preguntará el número de consultas por año que realiza, y ése será el valor específico 
de X,, en la muestra. En seguida, sin eliminar el número obtenido en primer lugar, se selecciona un segundo 
número que identifica a otro (o quizá al mismo) agricultor, y se repite el experimento obteniendo un valor para 
X,. El procedimiento descrito arriba se continúa hasta obtener los 40 valores de las variables aleatorias en esa 
realización de la muestra. Obtener la muestra en la forma descrita equivale a hacer que en cada repetición del 
experimento cada uno de los agricultores tenga la misma probabilidad (1/20 000) de ser el elegido. La forma 
de hacer esto físicamente se explicará más adelante. Por lo pronto reflexionemos sobre el hecho de que no 
eliminar los números que van apareciendo tiene como consecuencia que el espacio muestral para la variable 
aleatoria X sea idéntico a los espacios muestrales de X;, X,..., X4o» tanto por lo que respecta a resultados posibles 
como a probabilidades de eventos, además de asegurar la independencia entre las variables aleatorias generadas 
por las repeticiones del experimento. La consecuencia de todo lo anterior es que, antes de elegir la muestra, 
podemos pensar en X;,..., X40 como en variables aleatorias independientes, todas con la misma función de 
probabilidades. 4 


En el ejemplo 7.1 se discutió la forma de obtener una muestra de variables aleatorias independientes con la 
misma función de distribución de probabilidades, sin decir cómo se efectuaría físicamente el proceso. Una 
forma que es conceptualmente simple, aunque no muy práctica, consiste en numerar 20 000 fichas idénticas 
excepto por el número, mezclarlas mediante algún proceso mecánico en una tómbola y extraer una de ellas, 
reemplazándola en la tómbola antes de la siguiente repetición del experimento. Esto asegura la independencia 
entre intentos y la igualdad de probabilidades en los mismos. 


Otra forma de hacerlo sería mediante el uso de una tabla de números aleatorios (ver referencia 7.1 al final de 
este capítulo). Esta forma de muestreo, de la cual ya se habló brevemente en el capítulo 6, se llama Muestreo con 
reemplazo. El lector debe notar que las mismas propiedades de las variables aleatorias se preservan si la población 
es infinita, o si la población es tan gran grande en relación con el tamaño de la muestra que la probabilidad 
condicional de que un elemento sea parte de la muestra es aproximadamente la misma que la incondicional, 
para todas las repeticiones del experimento, como sucedería en una población del tamaño de la del ejemplo 7.1. 
Por el contrario, si la población es tan pequeña en relación con el tamaño de muestra que las probabilidades de 
inclusión de un elemento de la población en la muestra se modifican sensiblemente para diferentes repeticiones 
del experimento cuando el muestreo se efectúa sin reemplazo, la elección de la muestra debe hacerse de tal 
forma que cada posible muestra del mismo tamaño tenga la misma probabilidad de ser elegida. Esto es, si de 
una población de tamaño N se quiere elegir una muestra de tamaño 2 (7 < N), el esquema de muestreo debe 


ser tal que todas las posibles muestras tengan la misma probabilidad 31 / de ser elegidas. Esta es 
n n 


la forma de obtener una muestra aleatoria en muestreo sin reemplazo, y se ejemplificará más adelante. 


ED 


Capítulo 7 


DISTRIBUCIONES DERIVADAS DEL MUESTREO 


Antes de continuar es conveniente hacer la siguiente aclaración. Tanto el muestreo con reemplazo (o de 
poblaciones infinitas) como el muestreo sin reemplazo de poblaciones finitas son importantes en la inferencia 
estadística. Sin embargo, en un texto elemental como éste, es de importancia primordial el muestreo con 
reemplazo (o de poblaciones infinitas). En lo sucesivo, y salvo algunos casos específicos en que lo haremos notar, 
nos referiremos a muestras de variables aleatorias independientes de acuerdo con la siguiente definición. 


Definición 7.1 (Muestra aleatoria). Sea X una variable aleatoria con función de distribución de probabilidades 
fy (x), que sirve como modelo probabilístico para una situación dada. Una muestra aleatoria de fy (x) es 
una colección de variables aleatorias independientes X;, X5,..., Xp cada una con función de probabilidades 


filx). e 


En seguida presentamos un ejemplo que introduce dos variaciones importantes en relación con el ejemplo 
7.1. La primera consiste en que en vez de tomar una muestra de variables aleatorias de una población ya 
existente, el investigador, en función de sus intereses, genera las observaciones de la población (o poblaciones) 
que necesita. Dicha situación se estudia en la parte de la estadística conocida como Diseños Experimentales. La 
segunda variación consiste en que se tiene una población infinita, en el sentido en que se ha usado el término 
en los párrafos precedentes. 


Ejemplo 7.2. Un agrónomo especialista en suelos desea investigar el crecimiento de una conífera (Pinus greggii) 
en suelos con dos niveles de nitrógeno. Con ese objeto planta en suelos con los dos niveles de nitrógeno 15 
pinos en cada uno y, al cabo de cierto tiempo, mide las alturas de los 30 pinos. Si denotamos por X»... 
X;¡5 a los elementos de la muestra en el primer nivel, y por Y;,...,Y,5 a los del segundo nivel, tenemos dos 
muestras aleatorias, cada una con 15 observaciones. Para cada una de las muestras, la población de la que se está 
muestreando (población objetivo) puede visualizarse como el conjunto de las alturas de todos los especímenes de 
Pinus greggi que existen y existirán bajo las condiciones en que se obtuvo cada muestra y, por tanto, la población 
es infinita. En estas condiciones pueden usarse modelos probabilísticos para representar el comportamiento de 
cada grupo de datos, digamos fy (x) para un nivel de nitrógeno, y fy (y) para el otro. 4 


Los ejemplos 7.1 y 7.2, amén de toda la discusión previa, se usan en seguida para evidenciar la relación entre las 
definiciones 4.17 y 7.1. Los puntos de relevancia son: 


a) Inicialmente X,, X»... X„ representan variables, cada una de las cuales puede tomar diferentes valores. 
Puesto que el valor específico que tomarán es desconocido antes de elegir la muestra, se considera que 
cada X; (i = 1, 2,..., 12) es una variable aleatoria. 


b) La forma de seleccionar la muestra puede hacer que las variables aleatorias que la integran sean 
dependientes o independientes. En nuestras discusiones, salvo que se diga explícitamente lo contrario, 
las variables aleatorias X;, X»... X, se considerarán independientes, y diremos que la muestra es aleatoria. 

2 n y 


MeéroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIC 
Infante-Gil y Zárate de Lara 


c) Una vez que se ha seleccionado la muestra, cada una de las variables habrá tomado uno y sólo un valor 
numérico, el cual lo denotaremos por x; (¿ = 1, 2,..., 1). Estos valores numéricos son el conjunto de 
resultados que constituyen la muestra en el sentido de la definición 4.17. A los valores específicos x}, 
X>»... Xp Se les denomina una realización de las variables aleatorias X}, X»... A, Algunos autores, con 
excelente lógica, han propuesto el nombre de “observables” para las variables aleatorias X,- A,» y el de 
“observaciones” para los elementos de la realización x}, X)»..., Xy 


7.2. Estadísticas y sus distribuciones 


En la sección 7.1 se discutió el concepto de muestra y el de una realización de ella. Los conjuntos de datos 
organizados, graficados y descritos mediante cantidades representativas (tales como X y S°) en los capítulos 2 y 
3 son precisamente realizaciones de muestras aleatorias. Siendo funciones de las muestras, cantidades como X y 
S? comparten la dualidad de éstas, es decir, que son variables aleatorias antes de tomar la muestra y realizaciones 
de dichas variables aleatorias una vez que la muestra se ha tomado. Estas ideas son tan importantes en la inferencia 
estadística que las profundizamos en seguida. En una investigación normalmente se toma una sola muestra y, 
por tanto, medidas como X y S 2 tienen un valor determinado por la realización de la muestra que ocurrió. Sin 
embargo, al menos conceptualmente siempre es posible tomar diferentes muestras, que darían lugar a otros (o los 
mismos) valores de X y S°. Para una muestra aleatoria, los posibles valores de variables aleatorias como X y 
S? tienen una distribución probabilística que depende de la función de distribución de probabilidades fy (x) 
que sirve de modelo para la característica bajo estudio. Por lo anterior, funciones de las variables aleatorias X,..., 
X, que constituyen la muestra, merecen que se les estudie por separado, y reciben el nombre de Estadísticas. 


Definición 7.2 (Estadística). Sea X,, X»... X;, una muestra de una función de distribución de probabilidades 
fy (x) . Una estadística es una función de X,..., X, que no involucra parámetros desconocidos. 4 


La definición 7.2 implica que, bajo condiciones que se cumplen para las funciones que se estudiarán en este 
texto, una estadística es una variable aleatoria, y como tal tiene una función de distribución de probabilidades, 
la que dependerá de cuál es la población y, por ende, de la fy (x) de la que se tomó la muestra. Son de especial 
interés las distribuciones de estadísticas como la media y la varianza muestrales, por lo que se estudian en las 
siguientes secciones de este capítulo. 


7.3. La distribución de la media muestral y el teorema central 
(fundamental) del límite 


Antes de establecer resultados generales sobre la distribución de X es conveniente ejemplificarlos con la 
distribución presentada en el ejemplo 7.1. La variable aleatoria X que se definió tiene función de probabilidades: 


Supongamos que se toma una muestra aleatoria de tamaño dos, es decir, que se tienen las variables aleatorias 
Xi, X,. Por la independencia entre ellas, la distribución conjunta de X, y X, es el producto de las marginales. Es 
decir, que: 
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Fx,..x, (,x2)= fx, (a) fx, (x)= fx (x): fy (D=[fx Co)]” 


ya que ambas variables tienen la misma función de probabilidades fy (x). Así, la probabilidad de que X, tome 
el valor uno y X, el valor tres es: 


P(X, =1,X, =3)=P(X, =1):P(X, =3) =(0.6)(0.1) = 0.06 


La distribución conjunta de X, y X, se presenta enseguida. 


P(X,=x) 0.1 0.6 0.2 0.1 1.0 


X +X, 


Las posibles realizaciones de X,, X,, así como los correspondientes valores de X = , Se muestran a 


continuación. 


Realización 


Las probabilidades correspondientes a cada media se obtienen fácilmente sumando las probabilidades de 
las realizaciones que resultan en un valor dado, ya que las diferentes realizaciones son eventos mutuamente 
excluyentes. Por ejemplo: 


e LI 
P(X =0.5)= pt 


= =05)= P(X,+X, =1) 
= P(X, =0,X, =1)+P(X, =1,X, =0)=0.06 +0.06 = 0.12 


A continuación se muestra la tabla completa. 
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La esperanza matemática o media de X es: 


nz = E(X) = Y xf7 (¥) = (0)(0.01) + (0.5)(0.12) 
+(1.0)(0.40) +(1.5)(0.26) + (2.0) (0.16) + (2.5) (0.04) 
+(3.0)(0.01)=1.3 


Pero, también: 


E(X,)=E(X,)= E(X)=0(0.1)+1(0.6)+2(0.2)+3(0.1)=1.3 


En este ejemplo hemos encontrado que £ (X)=E (X,)=E(X,). Esto puede generalizarse a cualquier 


tamaño de muestra n, ya que entonces: 


Fe in +X, ++X,) 
n 


y si 
E(X,)=E(X,)=""=E(X,)=ux 


tendremos: 


E(X)=E 


(EA e) A) ++ EX) 


1 nu 
=- [ux +A ht ]= E ux = EX) 
donde 4 y es la media de la población de donde se tomó la muestra o, dicho de otro modo, la media de la variable 


aleatoria que se usa como modelo. 


Por lo que toca a la varianza de X , es muy sencilla de derivar en el caso de una muestra aleatoria, ya que 
entonces, por la independencia entre las variables aleatorias X; ,..., X„ se aplica el resultado (5.29); es decir: 


Var(a, X, + 4a,X, + +a,X,)= a Var(X, J+ +a Var(X, ) 


= 1 5 
Para X , tomando a, =—(í=1,2,...,n), y suponiendo que la varianza de X; es O% , tenemos: 
n 


X; paet X 


Var(X) = o% = Var| 
n 


J=+ lo} +=-+03) 
n 


2 2 
_”9x _0x 
2 


n“ n 
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Este resultado general lo verificamos en seguida con el ejemplo que se ha venido usando previamente. En efecto, 
de la distribución de X se obtiene: 


E(X?) = Y x? fz (©) =(0)*(0.01)+(0.5)*(0.12)+(1.0)?(0.4) 
+(1.5)? (0.26) +(2.0)* (0.16) + (2.5)? (0.04) 
+(3.0)” (0.01) = 1.995 


De donde: 


0% =ElX?)-[E(X)' =1.995-(1.3} =1.995-1.690 = 0.305 
De la función de probabilidades fy (x), de donde se tomó la muestra, el lector puede verificar que: 
o% = Var(X) = 0.610 
y, por tanto, 


2 
o 0.610 
07 === =0.305 
n 2 


Para que el lector se percate de las diferencias cuando se muestrea una población finita sin reemplazo conviene 
recordar que, en ese caso, las variables aleatorias que integran la muestra no son independientes. Por tanto, en 
el cálculo de la varianza de X deben considerarse las covarianzas entre ellas, modificándose la expresión para la 
varianza de X como sigue: 


N-n 

N-=1 

se le llama factor de corrección por finitud de la población y ya se le había mencionado en la sección 6.5 en 
el caso particular de muestreo sin reemplazo de una población finita con sólo dos resultados posibles. Las 
consideraciones que allí se hicieron sobre la magnitud de este factor de corrección son válidas también en este 
caso más general. Así, en el ejemplo que nos ocupa, encontramos que el factor de corrección es prácticamente 
uno, debido a que » es muy pequeño en relación con N. En efecto, tenemos que: 


donde N es el tamaño de la población, » el tamaño de la muestra y 0% la varianza de la población. A 


N—=nm_ 20000-2 
N-—1 20000-1 


= 0.9999499975 


y la varianza de X , si se muestrea sin reemplazo, con n = 2, es: 


Var(X)= Eo = 0.30498 
200001) 2 
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prácticamente igual al valor 0.305 obtenido muestreando con reemplazo. La situación es diferente si el tamaño 
de muestra es grande en relación con el tamaño de la población (ver ejemplo 7.3). 


2 2 
N=njO0 o ; i 
— < — , de donde podemos concluir que el muestreo sin reemplazo, al 

N=1) a n 
forzar a que en la muestra únicamente se incluyan elementos diferentes, ocasiona que la muestra tenga mayor 


información sobre la población, lo que se refleja en menor varianza de la media muestral. 


El lector debe notar que I 


Ejemplo 7.3. Un laboratorista está determinando el contenido de fósforo en soluciones, utilizando un 
colorímetro. Ha realizado cinco determinaciones en cinco diferentes tubos de ensayo, obteniendo los siguientes 
contenidos de fósforo en p.p.m. 


p.p.m. 6 7 9 2 11 


Suponga que se va a tomar una muestra de tamaño tres de la población integrada por las cinco mediciones. 
Puesto que se tienen sólo cinco valores con la misma frecuencia relativa, la función de probabilidades de la que 
se va a muestrear es: 


1 
=; x = 2,6,7,9,11 
fx (x)= 5 


0, de otra forma 


Por lo que es fácil verificar que: 
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Mz =7 

oy =9.2 
Consideremos ahora por separado los casos de muestreo con y sin reemplazo. 
Muestreo con reemplazo 


Se toman tres observaciones independientes. Las posibles tercias de observaciones (cada tercia con la misma 
P p 
probabilidad), los valores posibles de y su función de probabilidades se listan en seguida. 


Realizaciones x P(X =x) 
(2,2,2) 6/3 1/125 
(2,2,6)(2,6,2)(6,2,2) 10/3 3/125 
(2,2,710,7,2)(7,2,2) 11/3 3/125 
(2,2,9)(2,9,2)(9,2,2) 13/3 3/125 
(2,6,6)(6,2,6)(6,6,2) 14/3 3/125 
(2,2,11)(2,11,2)(11,2,2)(6,2,7)(2,6,7)(2,7,6)(6,7,21(7,2,6)(7,6,2) 15/3 9/125 
(2,7,71(7,2,7)(7,7,2) 16/3 3/125 
(2,6,9)(6,2,9)(6,9,2)(2,9,6)(9,2,6) (9,6,2) 17/3 6/125 
(2,7,9)(2,9,7)(6,6,6)(7,2,9)(7,9,2)(9,2,7) (9,7,2) 18/3 7/1125 
(2,6,11)(2,11,6)(6,2,11)(6,6,7)(6,7,6)(7,6,6)(11,2,6)(11,6,2)(6,11,2) 19/3 9/125 
(2,7,11)(2,11,7)(7,2,11)(7,11,2)(11,2,7)(11,7,2)(6,7,7)(7,6.7)(7,.7,6)(2,9,9)(9,2,9)(9,9,2) 20/3 12/125 
(6,6,9)(6,9,6)(9,6,6)(7,7,7) 21/3 4/125 
(2,9,11)(2,11,9(9,2,11)(9,11,2)(11,2,9)(11,9,2)(6,7,9)1(6,9,7)(7,6,9(7,9,6)(9,6,7)(9,7,6) 22/3 12/125 
(6,6,11)(6,11,6)(11,6,6)(7,7,9(7,9,7)(9,7,7) 23/3 6/125 
(2,11,11)(1,2,11)11,11,2)(6,7,11)(6,11,7)7,6,1)(,11,60)/(11,6,7)(11,7,6)(6,9,9)(9,6,9)(9,9,6) 24/3 12/125 
(7,7,11(7,11,7)11,7,7)(7,9,9(9,7,9)(9,9,7) 25/3 6/125 
(6,9,11)(6,11,9)(9,6,11)(9,11,6)(11,6,9)(11,9,6) 26/3 6/125 
(7,9,11)(7,11,9(9,7,11)(9,11,7)(11,7,9(11,9,7)(9,9,9) 27/3 7/125 
(6,11,11)(11,6,11)(11,11,6) 28/3 3/125 
(7,11,10)(1,7,10)(11,11,7)(9,9,11)(9,11,9(11,9,9) 29/3 6/125 
(9,11,11)(11,9,11)(11,11,9) 31/3 3/125 
ALLI 33/3 1/125 
5 125/125 


De esta función de probabilidades el lector puede verificar (mediante algún trabajo aritmético) que: 


py =E(X)= FPX =7)=70 
> 2 _ 58575, 3450 
(9)(125) (9)(125) 
_188 92 o% 0% 


A 
vi 
w 
es 
x3 
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Muestreo sin reemplazo 


Si la muestra se toma sin reemplazo, debemos cerciorarnos de que todas las posibles muestras de tamaño 3, 


5 
3 


las 10 muestras y seleccionando un número al azar para determinar qué muestra es la que se tomará. Las 10 


realizaciones posibles, los valores correspondientes de X y sus probabilidades se presentan enseguida: 


o sea las | |- 10 muestras, tengan probabilidad 1/10 de ser elegidas. Esto puede conseguirse numerando 


Realización x P(X =7) 
(2,6,7) 15/3 1/10 
(2,6,9) 17/3 1/10 
(2,7,9) 18/3 1/10 
(2,6,11) 19/3 1/10 
(2,7411) 20/3 1/10 
(2, 9,11)(6, 7, 9) 22/3 2/10 
(6,7,11) 24/3 1/10 
(6,9,11) 26/3 1/10 
(7,9,11) 2719 1/10 


Usando la función de probabilidades se encuentra: 


<< 210 
E(x)==2=7 
30 
y des = 172 4548 > 
Dad le 82% 
90 
s138 1198). 1/92) _ 10% 
90 2145) 2 MY 


y encontramos que la varianza de la media es la mitad de la que tenía en muestreo con reemplazo. Esto se debe 
a que con N = 5 y n = 3 el factor de corrección es: 


En las páginas anteriores se han obtenido resultados con respecto a la media 

y la varianza de la media muestral de una muestra tomada de una función 
de probabilidades arbitraria fy(x). Por lo que toca a la distribución de 
probabilidades de X , debe decirse que depende de fy (x), por lo que no 
se tiene ningún resultado general sobre la distribución de X, excepto un 


resultado importantísimo que da una distribución aproximada para X . De 


nuevo reiteramos que, en lo sucesivo, los resultados que se presentan son 
para la media de variables aleatorias independientes, es decir, para la media rra Sia Lapa 
de lo que llamamos una muestra aleatoria, y no volveremos a ocuparnos del 1749-1827 
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muestreo sin reemplazo de una población finita, tema del que se ocupan acuciosamente todos los autores 
clásicos de la rama de la estadística conocida como Muestreo. El resultado al que nos referíamos en el párrafo 
anterior es conocido con el nombre de Teorema Central (fundamental) del Límite y nos atrevemos a calificarlo 
como uno de los teoremas más notables en Matemáticas. En la teoría de la Estadística tiene una relevancia 
que lo hace destacar como una piedra angular sobre la que descansan gran parte de los métodos estadísticos. 
El teorema se presenta a continuación. 


Lo sorprendente del Teorema Central (fundamental) del Límite es que establece que para un tamaño de 
muestra grande la distribución de X es aproximadamente normal, independientemente de que la variable 
aleatoria X, de cuya función de probabilidades se muestrea, sea discreta o continua, de que fy (x) sea 
simétrica o asimétrica, o de la forma que ésta tenga. Sin embargo, la expresión, “tamaño grande de muestra” 
es ambigua, y el hecho es que el tamaño de muestra para el cual la aproximación es buena depende de la 


forma de fy (x). 


Con objeto de que el lector tenga una idea de la bondad de la aproximación presentamos en seguida un ejemplo 
extremo, en el cual la distribución fy (x) es discreta y marcadamente asimétrica. En la sección 7.8 se presenta 
un caso de mucha importancia, por medio del cual se aproximan probabilidades en la distribución Binomial 
mediante la Normal. 


Ejemplo 7.4. La función de probabilidades de una variable aleatoria X es: 
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La gráfica de la distribución de X se presenta enseguida. 


fix) 


0.30 
0.25 


0.20 


-4 -3 -2 -i 


Figura 7.1. Distribución de fy (x) para ilustrar el Teorema Central (fundamental) del Límite. 


De la Figura 7.1 es evidente que la distribución de probabilidades de X dista mucho de parecerse a una 
distribución Normal. Con objeto de ver la rapidez con que la distribución de medias se aproxima a una 
Normal, se tomaron 100 muestras aleatorias de tamaño 2 de fy (x), y se calculó la media aritmética para 
cada una de las 100 muestras. En la Figura 7.2a se presenta el histograma correspondiente. A pesar de que 
el histograma que se muestra no tiene mucha similitud con una Normal, el lector debe notar que la Figura 
en 7.2b es mucho más simétrica que la de fy (x). Otro hecho notable es que en la distribución de la media 
muestral con » = 2 empieza a insinuarse un eje de simetría alrededor del valor X =-—1 . El lector debe 
verificar My =—1, y lo sorprendente es que aun con » = 2 empiece a manifestarse la simetría alrededor 
del valor esperado de X, a pesar de que en la función de probabilidades de X la probabilidad del valor — 1 
es cero. Puesto que un tamaño de muestra de dos es pequeño, en la Figura 7.2b se presenta el histograma 
obtenido con 100 muestras de tamaño 5 de la misma fy (x). En esta gráfica la similitud con la Normal es 
muy marcada. El hecho de que los rectángulos a la izquierda del que está centrado en u x tengan mayor área 
que los situados a la derecha, obedece al gran peso que tiene el valor X = —4 en fx (x) . Con tamaños de 
muestra mayores la aproximación a la Normal es mejor. 
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Figura 7.2. Histogramas de medias muestrales para tamaños de muestra 2 y 5. ® 


Una forma alternativa de presentar al Teorema Central (fundamental) del Límite consiste en considerar sumas 
de variables aleatorias, en vez de medias de las mismas. En efecto, obsérvese que: 


n 


$s 


1 


Ra) AE) A 


— is 


O y Oy = 0: Án 
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de tal forma que el teorema puede enunciarse como sigue: 


7.4. Distribución de la media muestral en 
muestras aleatorias de la distribución Normal 


En la sección 7.3 afirmamos que el único resultado general con respecto a la distribución de una media muestral 
se tiene mediante el Teorema Central del Límite, y nos da una distribución aproximada. Sin embargo, en el muy 
importante caso de muestras de la distribución Normal se tiene un resultado exacto. Según se demostró antes, 
para cualquier fy (x) con media uyy varianza o% , la media de una muestra aleatoria es tal que E(X)= uy 


y Var[X)=07”, In. El Teorema Central del Límite establece que, para n grande, X es aproximadamente 
normal con la media y varianza ya anotadas. En estas condiciones parece natural el siguiente resultado, que se 
presenta sin prueba. 
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La principal diferencia de estos resultados con el Teorema Central del Límite consiste en que si la muestra 
aleatoria es de una distribución Normal, la distribución de X es exactamente Normal, y esto se cumple para 
cualquier tamaño de muestra. Las expresiones (7.8) y (7.9) nos permiten usar las tablas de la normal estándar en 
el cálculo de probabilidades que involucran a la media muestral de variables aleatorias Normales independientes, 
tal como se muestra en los siguientes ejemplos. 


Ejemplo 7.5. Suponga que X ~ N(30,81). Encuentre la probabilidad de que la media aritmética de una 
muestra de tamaño 25 sea mayor que la media poblacional (u = 30) por más de 5 unidades. 


La probabilidad buscada es: 


O EA > ca 


= P(Z > 2.78) = 0.0027 


Con la misma distribución suponga que se toma una muestra de tamaño 4, es decir, que ahora n = 4. Calculando 


de nuevo la probabilidad de que X exceda a 4 por más de 5 unidades se obtiene: 


Va(X-u) _ v46) 
o 9 


pda ZEA [resimo 


Aquí observamos que la probabilidad con 1 = 4 es mucho mayor que con 2 = 25, es decir, que con mayor 
tamaño de muestra la probabilidad de alejarse de 4 por más de 5 unidades es pequeña, comparada con la misma 
probabilidad para una 7 menor. Esto se debe a que la varianza de X es inversamente proporcional al tamaño 
de muestra. En efecto, con n = 25: 


var) == 3.24 
25 


en cambio, con n = 4: 


== 8i 
Var(X)===20.25 
4 
El efecto de aumentar el tamaño de muestra es disminuir la varianza de X . En este caso se dice que se tiene 
más información sobre el parámetro 4, como es razonable esperar si se toma una muestra de mayor tamaño. ® 


Ejemplo 7.6. La variable aleatoria X tiene una distribución N (50,100). Se quiere calcular la probabilidad de que 
en una muestra de tamaño 25, X difiera de la media poblacional por menos de 4 unidades. 
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La probabilidad buscada es: 


10 o 10 
= P(—2 < Z < 2) = 0.9544 


| 


V254) _ Jn (X a) R ka 


Ejemplo 7.7. Con la misma distribución del ejemplo 7.6 se quiere encontrar dos valores equidistantes de 4, tales 
que el 90% de todas las medias muestrales posibles se encuentren entre ellos. De la tabla de áreas de la Normal 
estándar obtenemos: 


P(-1.645 < Z <1.645) = 0.90 


Jn (X —u) 


y, por tanto, para la variable aleatoria Z=—————- se tiene: 
O 


Vn(X —u) 


p( 1.545 < < 1645)=090 


por lo que, con » = 25, u = 50 y O = 10 obtenemos, despejando a X , 


P = P(—3.29 < X — u < 3.29) 


p . 


CA 
5 
= P(46.71< X <53.29)=0.90 


La interpretación práctica de este resultado es que en muestras de tamaño 25 de una población N (50, 100) la 
media aritmética estará en el intervalo (46.71, 53.29) aproximadamente el 90% de las veces, si se toma un gran 
número de muestras de tamaño 25. El lector puede verificar que los límites del intervalo están más cerca de 50 
(el valor de 4) si se toman muestras de mayor tamaño. 


Los ejemplos 7.5, 7.6 y 7.7 son aplicaciones sencillas del resultado que establece la distribución de la media 
aritmética de una muestra aleatoria de una distribución Normal. En los capítulos siguientes se explotará 
ampliamente dicho resultado. Vale mencionar que si la población de la que se toma la muestra no es Normal, 
las afirmaciones probabilísticas de los tres ejemplos son aproximadamente ciertas, en virtud del Teorema Central 
del Límite. La bondad de la aproximación depende de la forma de la distribución fy (x) de la que se toma la 
muestra, y del tamaño de ésta. 


7.5. Propiedades de la varianza muestral (s2) y su distribución en muestras 
aleatorias de una Normal 


. . . Da -z . “to . 
Para investigar algunas propiedades de 5” iniciamos esta sección con un ejemplo, utilizando la misma Jex) 
de la sección 7.1. Es decir, de la siguiente función de probabilidades 
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Xx 0 1 2 3 $ 
Fx Ax) 0.1 0.6 0.2 0.1 1.0 


Supóngase, como en la sección 7.3, que se toma una muestra aleatoria de tamaño dos de esta distribución. Las 
: 0 3 2 : 
16 posibles realizaciones de la muestra, con los valores correspondientes de 5”, se presentan enseguida. 


(0,0) (1,1) (0,1) (1,0) (1,2) (0,2) (1,3) (0,3) 
(2,2) (3, AS a 1) = z (3,2) 2o SER 


Valor | Valorde® | Ss 


Las probabilidades para cada valor de 5? se calculan de manera idéntica a como se hizo en el caso de la media. Así: 


P(S? =4.5)= P(X, =0,X, =3)+ P(X, =3,X, =0) 
= P(X, =0):P(X, =3)+P(X, =3):P(X, =0) 
= (0.1)(0.1)+ (0.1)(0.1) = 0.02 


Las probabilidades se anotan en la siguiente tabla. 


s? f ¿ i 5 


P(S =$) ' y y j 1.0 


La esperanza matemática de $? es: 
Els?) =0(0.42)+0.5(0.40) + 2(0.16)+4.5(0.02) = 0.610. 


El lector debe notar que en la distribución fx (x), de la que se está muestreando, 0% = 0.610 ; por lo que 
tenemos que en este ejemplo E(S*)=07% . 


Esto ilustra un resultado general que se anota a continuación. 
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El resultado (7.10) es fácil de probar. En efecto, ya que X;,..., X, es una muestra aleatoria de fy (x), se tiene que 
E(X,)= u yVar(X,)=07, (¡=1,2,....n) 


Ahora, puesto que 


> 


var(X,)= E(x2)-[E(x)] = E(x?)- 1 
puede escribirse: 


Elx?) =0 + (7.11) 


También sabemos, de la sección 7.3, que en una muestra aleatoria £ (X)=u y Var(X)= 0? / n, de donde, 


escribiendo Var(X)= E(X? )-lE DY =E(X? )- ¡2 , se obtiene: 
El(X?)=0? In+ 1? (7.12) 


Las expresiones (7.11) y (7.12) son muy útiles para encontrar el valor esperado de la varianza muestral, como 
se muestra enseguida. 


(5) 


n—1 


y, usando (7.11) y (7.12) obtenemos: 


(5) [$l +e) +o* 10) 


"E. (nu? +n0? -ap -0° )= L_ (no? —0?) 
n—1 a! 
¿ED _ 

n—l ? 


que es lo que se quería probar. 


La expresión (7.10) es la única que presentaremos para una muestra de una función arbitraria de probabilidades 

fy (x) . A continuación nos referimos al muy importante caso particular en que la muestra aleatoria se toma de 
. + a Eg . . . 2 

una población cuyo modelo probabilístico es Normal, con media 4 y varianza O”. 


Capítulo 7 


DISTRIBUCIONES DERIVADAS DEL MUESTREO 


Probar de manera rigurosa la afirmación en el recuadro anterior requiere conocimientos de Estadística 
Matemática que corresponden a textos más avanzados. Aquí sólo se presenta el resultado por la gran importancia 
que tiene en las técnicas de inferencia que se estudiarán a partir del capítulo 8. De paso hacemos notar que la 
expresión (7.13) nos permite verificar de manera muy sencilla que, en la Normal, E (s*)=07, ya que del 
capítulo 6 sabemos que la esperanza de una variable aleatoria Ji-cuadrada es igual a sus grados de libertad. Se 
tiene entonces: 


(n—1)8? 


o? 


E 


=n-—1 


de donde: 
El(s?)=0? 


7.6. Distribución de /n (X—u)/S en muestras aleatorias de una Normal 


En las secciones 7.3 y 7.4 se presentaron varios resultados relacionados con la media muestral. En particular 
se estudió la distribución de V7 (X -= u)/ O, tanto en una distribución arbitraria como en el caso específico 
en que X esla media de una muestra aleatoria de N (uo 2) Enel primer caso se invocó el Teorema Central 
(fundamental) del Límite para aseverar que la distribución aproximada de la media muestral estandarizada 
es N (0, 1). En el segundo caso la distribución es exactamente N (0, 1). En esta sección nos proponemos 
investigar el efecto que tiene sustituir O por S (la desviación estándar muestral) en la distribución de la 
media muestral estandarizada. En otras palabras, se quiere encontrar la distribución de la variable aleatoria 


Vn(X—u)/S cuando X y S son la media y la desviación estándar de una muestra aleatoria de N ( u, a?) . 


Para obtener la distribución de Va (X -—u)/S recordamos dos proposiciones previas: si X;,..., X, es una 


muestra aleatoria de N ( uo?) , y X y S° son la media y varianza muestrales respectivamente, entonces, de 
acuerdo con (7.9): 
Jn (X- 
ia ~ N(0,1) 


además, por (7.13): 
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Por añadidura, las variables aleatorias n(X—u)/0 y (n—1)57* / 07 son independientes. Entonces, de la 
definición de una variable aleatoria + de Student (definición 6.10) tenemos que: 


Va(X-u) 


De donde, simplificando el cociente, se obtiene: 


Vna(X-u) 


ES ~H n—1) 


o sea que la distribución buscada es la ż de Student con 2 — 1 grados de libertad. 


Sea X;,..., X, una muestra aleatoria de N (1,0?) , y sean X y S? la media y la varianza muestrales, 
respectivamente. La variable aleatoria V2 (X —u)/S tiene una distribución + de Student con 2 — 1 


grados de libertad. En símbolos: 
vn (X—u) 


S m1) 


La importancia del resultado recién obtenido no será evidente sino hasta el capítulo 8, en que 
empiecen a estudiarse técnicas de inferencia estadística. Sin embargo, y para que el lector se 
forme una idea de dicha importancia, mencionaremos un hecho histórico: la distribución 
de ż fue descubierta por W. S. Gossett buscando la distribución de Vn(X—u)/S. La 


presentación que hemos hecho en el capítulo 6 es una generalización posterior. 


7.7. Distribución de una razón de varianzas muestrales 
(dos muestras de distribuciones Normales) 


En esta sección presentamos una aplicación muy importante de la distribución de 

F, que se presentó en la sección 6.13. La definición 6.11 establece que si dos variables 
> > 

aleatorias Xi.) Y Xí,) son independientes, entonces: 


William Sealy Gosset 


876-1937 


y 
Xim [m z 


? n 


lim |? 
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Para utilizar este resultado en relación con las distribuciones de las estadísticas que se han derivado en este 
capítulo, considérese la siguiente situación. Sea X;,..., X,, una muestra aleatoria de N (u x ,07%) y sea Y ,..., 
Y, una muestra aleatoria de N (uy, o? ) . Es decir, que el modelo probabilístico para las variables aleatorias 
en la primera muestra es fy (x), donde X ~ N ( Mi ) , mientras que para la segunda muestra el modelo 
es fy(y), donde Y - N ( My 07) . Si denotamos por Si y SẸ a las varianzas muestrales respectivas 


tenemos, de acuerdo con (7.13), que: 


(m-1)S > 
o, (m—1) 
y 
Mm=-DS? > 
o? X(n—1) 


Si además las muestras aleatorias son independientes tenemos, por la definición de F, que: 


Lo anterior se resume en seguida, antes de presentar una aplicación interesante en el ejemplo 7.8. 
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Ejemplo 7.8. Un laboratorista dispone de un equipo de calibración que le da resultados satisfactorios desde el 
punto de vista de la variabilidad de sus determinaciones. Se le ofrece un equipo nuevo que se supone tiene la 
misma varianza que el que usa. Para comparar las dos varianzas realiza 61 determinaciones con el nuevo equipo 
y 41 con el equipo propio. ¿Cuál es la probabilidad de que la varianza muestral con el nuevo equipo sea el doble 
o mayor que la de las determinaciones con el equipo propio, suponiendo que la afirmación de igualdad de 
varianzas en los equipos sea cierta? 


Si denotamos por X;,..., X61 y Yp- Y¿y a las muestras aleatorias del experimento, y suponemos que las 
condiciones para los resultados (7.15) y (7.16) se cumplen, tenemos: 


2 
P(S} >25?)=P $e 2|=P(E% >2) 


En la tabla I leemos: 
P(ES >2.02)=0.01 


por lo que la probabilidad buscada es (muy) aproximadamente 0.01. De aquí que si el laboratorista encuentra 
que la varianza muestral con el nuevo equipo es el doble o mayor que con el propio, difícilmente creerá en la 
afirmación de que tienen la misma varianza. 4 

q 


7.8. Aproximación normal a la Binomial 
(una aplicación del Teorema Central (fundamental) del Límite) 


En el cálculo de probabilidades en una distribución Binomial (y en otras distribuciones discretas), nos 
encontramos a menudo con el problema de que las tablas disponibles son muy limitadas, y el cálculo manual, 
o aun con calculadora, es tedioso”. Ahora bien, el lector recordará del capítulo 6 que algunos modelos 
probabilísticos pueden generarse como una suma de variables aleatorias. En particular, la suma de variables 
aleatorias independientes Bernoulli con el mismo parámetro p tiene una distribución Binomial. En ese caso 
puede usarse la versión alternativa del Teorema Central del Límite para aproximar probabilidades en la variable 
aleatoria definida por la suma. En esta sección nos referimos específicamente a una distribución Binomial, 
aunque recalcamos que el teorema puede aplicarse a cualquier suma de variables aleatorias independientes 
con la misma función de distribución de probabilidades. En el capítulo 8 se usa el teorema para aproximar 
probabilidades en una suma de variables aleatorias Poisson con parámetro Å. 


Este comentario no se aplica con las computadoras personales, pero ayuda a documentar el ms original de este texto. (Nota añadida a la 


tercera edición). 
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En el caso que nos ocupa, la variable aleatoria Binomial con parámetros n y p puede representarse por 
X=X +X,+-"+X,,, donde cada X, tiene una distribución Bernoulli con parámetro p, y las n variables 
aleatorias son independientes. Puesto que en este caso E(X,)= p y Var(X,)= pg (¡=1,2,...,n), la expresión 
(7.7) puede escribirse: 


X—=mp | 


= N(0,1) 
Voq 


de acuerdo con el resultado anterior, si se quiere calcular probabilidades en una binomial, puede usarse la 
siguiente aproximación. Si X ~ x Bin(n, p): 


pasxon eszet] 


donde Z ~ N (0,1). 


Por supuesto, la bondad de la aproximación depende de qué miembro de la familia Binomial se trate, es decir, 
del tamaño de muestra (7) y de la probabilidad p de éxito en cada intento. Por lo que toca al valor de p, debe 
recordarse que la Binomial es simétrica para p = 0.5, y más asimétrica a medida que p se acerca a cero o a uno. Es 
natural entonces que la aproximación mediante la Normal (una distribución simétrica) sea mejor para valores de 
p cercanos a 0.5. En cuanto a », debe tomarse en conjunción con p. Así, para p = 0.5, aun tamaños de muestra 
(n) de 25 o 30 dan buenas aproximaciones, mientras que si p es menor que 0.1 o mayor que 0.9, se requieren 
tamaños de muestra mayores. Una regla práctica, enunciada por algunos autores, sostiene que la aproximación 
es buena cuando tanto np como nq son mayores que 15. Enseguida presentamos un ejemplo con n = 25 y p = 
55, con objeto de poder usar la tabla A para verificar la exactitud de la aproximación. Con esos parámetros 
para una Binomial, la expresión (7.6) nos dice que la distribución Normal que se le aproxima es la que tiene 
media u =(25)(0.55)=13.75 y 0? =(25)(0.55)(0.45) = 6.1875 . En la Figura 7.3 se grafica el histograma de 
probabilidades de la distribución Binomial (25, 0.55) y la Normal (13.75, 6.1875). 


fx (x) 


6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 


Figura 7.3. Gráfica de la Distribución Normal (13.75, 6.1875) e histograma de probabilidades de la distribución Binomial(25,0.55). 
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Puede verse, de la Figura 7.3, que las dos distribuciones se parecen. Para tener una ilustración numérica calculamos 
P(17 < X <19) mediante la distribución exacta y usando la aproximación Normal. La probabilidad exacta se 


obtiene fácilmente de la tabla A, como sigue: 


P(17<X<19)=P(X <19)—P(X <16)=0.9914-0.8660 = 0.1254 


La probabilidad aproximada mediante la Normal es: 


6.1875 „npg — /6.1875 


+ P(1.31 < Z < 2.11) = 0.9826 — 0.9049 = 0.0777 


P(17<X<19)= E a A a 


La aproximación, sin ser mala, puede mejorarse si observamos en la Figura 7.3 que la probabilidad que deseamos 
aproximar (la de los 3 rectángulos sombreados) corresponde en la curva Normal al área entre 16.5 y 19.5. En 
efecto, si calculamos en la Normal la probabilidad entre esos dos valores obtenemos: 


P(16.5<X< por az da a 


/6.1875 ~ 6.1875 
= P(1.11 < Z < 2.31) = 0.9896 — 0.8665 
=0.1231 


probabilidad que se acerca bastante a la correcta. El lector puede verificar en la Figura 7.3, que para dos valores 
cualesquiera a y b (a < b) que pueda tomar la variable Binomial X, el área bajo la curva normal que usualmente 
aproxima mejor la probabilidad de que X tome un valor entre a y b, es la comprendida entre a — 0.5 y b + 0.5. 
Dado que esta corrección da buenos resultados porque las probabilidades que se quieren aproximar son de una 
variable aleatoria discreta, se le llama Corrección por continuidad. 
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Con la misma lógica que nos llevó a la corrección por continuidad podemos obtener una aproximación a la 
probabilidad de que la variable aleatoria X, distribuida Bin(», p), tome un valor particular k. En la Figura 7.3 
es claro que el rectángulo cuya área representa la probabilidad de que X tome el valor k corresponde al área 
delimitada en la curva normal por k — 0.5 y k + 0.5. 


Tenemos entonces que si X ~ Bin(n, p), 


pocos E iia haa 


Vrea Voq 


Ejemplo 7.9. Utilizando el mismo ejemplo que dió lugar a la Figura 7.3, queremos calcular la probabilidad de 
que si X ~ Bin(25,0.55) , X tome el valor 16; es decir, queremos obtener P(X =16). 


(7.19) 


De la expresión (7.19) obtenemos: 


aia e diha | 


AO A 
6.1875 6.1875 


= P(0.70< Z <1.11)=0.8665-—0.7580 = 0.1085 


La probabilidad exacta, que puede ser obtenida de la distribución Binomial correspondiente, es 0.1084, por lo 
que la aproximación es excelente. 6 


Para finalizar esta sección destacamos el hecho de que la corrección por continuidad es significativa sólo cuando 
np, ng o ambos son pequeños. Esto es porque si 2pg es muy grande, la adición o substracción de 0.5 en el 


numerador no afecta mucho a los límites para Z en la ecuación (7.18), ya que el denominador (Japa) es 
grande. Lo anterior se ejemplifica en seguida. 


Ejemplo 7.10. En la distribución Binomial (900, 0.4) se quiere encontrar P(X > 385). Usando aproximación 
normal sin corrección por continuidad se obtiene: 


e 385 — (900)(0.4) 


/(900)(0.4)(0.6) 


pzas P| z |- rezim 0048 


y, usando la corrección: 


385 — 0.5 — 900 (0.4) 


P(X 2385) = pz > 
(900)(0.4)(0.6) 


- P(Z >1.67)=0.0475 


y el efecto de la corrección por continuidad es despreciable. 6 
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7.4. 


En la teoría de la herencia del tipo de sangre de los seres humanos se tienen 6 posibles composiciones 
genéticas (genotipos), que son: 


OO AA AO BB BO AB 


La primera composición corresponde a individuos con tipo de sangre O. La segunda y tercera dan el 
tipo A, la cuarta y quinta dan el tipo B, y la sexta el tipo AB. Suponga que se tienen 6 individuos, cada 
uno con uno de los genotipos posibles. Escriba las posibles muestras de tamaño dos de esa población, 
muestreando tanto con reemplazo como sin reemplazo. 


Refiriéndose al ejercicio 7.l., defina la variable aleatoria X como las veces que aparece la letra O (se 
le llama un alelo en la nomenclatura genética) en la composición de un individuo. Sean X, y X, las 
variables aleatorias definidas igual que X en cada elemento de la muestra. 


a) Encuentre fy (x) y calcule Uy y 0%. 

b) Para muestreo con reemplazo y sin reemplazo encuentre fy (x) y calcule E(X) y Var(X). 
Verifique sus cálculos para Var(X) usando las ecuaciones (7.2) o (7.3) según corresponda. 

Calcule el “factor de corrección por finitud de la población” para los siguientes tamaños de población 


(N) y tamaños de muestra (7). 


a) N=10,n=2 


b) N=50,n == 2 
c) N= 100, n = 2 
d N= 10,n = 4 
e) N=50,n=4 


f) N= 100,n = 4 
g) N=10,7=8 
h) N=50,n=8 
i) M= 100,7 = 8 


Este ejercicio tiene por objeto ilustrar el Teorema Central (fundamental) del Límite y requiere la 
colaboración de todos los estudiantes del curso bajo la supervisión del instructor. Se trata de que 
4 grupos distintos de estudiantes obtengan cada uno 100 muestras aleatorias de una distribución 
uniforme discreta en los primeros nueve enteros positivos. El primer grupo obtendrá muestras 
de tamaño 2, el segundo de tamaño 5, el tercero de tamaño 10 y el cuarto de tamaño 20. Cada 
grupo calculará sus 100 medias muestrales y construirá la tabla de frecuencias y el correspondiente 
histograma de frecuencias relativas. Finalmente se compararán los cuatro histogramas, observando 
cómo se aproximan a la forma de la distribución Normal. 
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7.5. Suponga que se toma una muestra aleatoria de tamaño 100 de una distribución de Poisson con 


100 g 
parámetro Å = 0.1. Sean X;,..., X¡ yy los elementos de la muestra y sean Siop = => X; y Xio = T 
i=l 


a) Calcule la media y varianza de X 100 - 
b) Usando el teorema central del límite calcule (aproximadamente) P (So 3: 


c) Calcule ahora exactamente P (Sioo < 5) y compárela con la obtenida en el inciso b). Para obtener 
la probabilidad exacta utilice el siguiente resultado: si X;,..., X, es una muestra aleatoria de P q), 


entonces $, = 5x, tiene una distribución P (14). 


i=] 


7.6. ii que Y, Y,..., Yoo son variables aleatorias independientes, cada una con la distribución 
100 


. Sea Sioo = >Y 


a) Calcule P (Soo > 124.342) usando la tabla de la distribución Ji-Cuadrada. 


b) Aproxime P (Soo > 124.342) usando el teorema central del límite. Recuerde que E ( Y) =y y 
Varl y;)= 


7.7. Una compañía aseguradora de vehículos ha establecido la siguiente distribución de probabilidades 
para el número de accidentes graves en que participa un vehículo asegurado en un semestre (X es el 


número de accidentes). 
Ed 0 1 2 
fa 0.70 0.20 0.10 


Suponga que se toma una muestra de tres asegurados. 


a) Verifique que E(X)=E(X) y Var[X)= Var(X) 


b) Encuentre la distribución de S? = 4 y verifique que E (s?)= 0% 


c) ¿Cuál sería la varianza de la media muestral en una muestra de tamaño 10? 
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q 


7.8. 


TH 


7:10: 


fokis 


72. 


713, 


7.14. 


WLS: 


El porcentaje de proteína (X) en una variedad de soya tiene una media de 23, con una desviación 
estándar de 2.0. Se realizan 10 determinaciones independientes del contenido de proteína en dicha 
variedad. Suponga que X tiene distribución Normal. 


a) ¿Cuál es la distribución de X , la media aritmética de las determinaciones? 


b) ¿Cuál es la probabilidad de que la X que se obtenga sea mayor de 24? ¿De que esté entre 22.5 y 
Pa 


c) Suponga ahora que se hacen 50 determinaciones. Calcule las mismas probabilidades que en el 
inciso bh). 


Refiriéndonos al ejercicio 7.8, suponga que la desviación estándar del porcentaje de proteína es 3.0. 
Repita los cálculos de los incisos bh) y c). 


Interprete los cambios en P(X > 24) y P(22.5< X <23.5) en los ejercicios 7.8 y 7.9, con respecto 
al aumento de tamaño de muestra y al aumento en la varianza de la distribución. 


Suponga que el peso neto por lata en una marca de sopa tiene una media de 565 gramos, con una 
desviación estándar de 15 gramos. Suponga distribución Normal de los pesos. 


a) Si se toma una muestra aleatoria de 9 latas y se registra el peso, ¿cuál es la probabilidad de que la 
media muestral esté entre 555 y 575 gramos? 


b) ¿De qué tamaño tendría que ser la muestra para que la probabilidad calculada en el inciso a) fuese 


0.9906? 


En una población con desviación estándar (0) igual a 20, ¿de qué tamaño debe tomarse una muestra si 
se quiere que la diferencia (en valor absoluto) entre la media muestral (x) y la media poblacional (u) 
sea menor de 8, con una probabilidad 0.9426? Suponga distribución Normal. 


Refiriéndonos al ejercicio 7.12, conteste la pregunta si la probabilidad deseada es 0.8030. 


Un proceso industrial produce mosaicos de 10 cm de ancho, con una desviación estándar (0) de 0.1 
cm. Si se toma una muestra de tamaño 16, calcule P (s? > 0.0183). Suponga distribución Normal. 


Suponga que dos poblaciones Normales tienen la misma varianza. Si se toman muestras 

aleatorias independientes del mismo tamaño (n), ¿para qué valor de n se cumple que: 
2/02 2 à 

p(s; IS > 2.124) =0.05 2, Sí y $2 son las varianzas muestrales. 


7.16. 


FIA 


7.18. 
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Calcule la probabilidad exacta y la aproximada (por el teorema central del límite) en cada uno de los 
siguientes casos (no utilice corrección por continuidad): 


a) P(X<4), si X ~ Bin(19,0.45). 
b) P(X 218), si X ~ Bin(24,0.65). 
c) P3 < X <17), si X ~ Bin(30,0.5). 


Repita los cálculos del ejercicio 7.16 usando corrección por continuidad. Note la importancia de la 
corrección para estos tamaños de muestra. 


Suponga que el 30% de los estudiantes inscritos en la Universidad Nacional Autónoma de México han 
tomado al menos un curso de Estadística. En una muestra aleatoria de 500 estudiantes sea X número 
de estudiantes que han tomado al menos un curso de Estadística. 


a) Calcule P(X =180). 


b) Sin usar corrección por continuidad calcule 
P(X 2170), P(X <140) y P145 < X <160) 


c) Repita los cálculos del inciso 4) usando corrección por continuidad. Note que la corrección es 
mucho menos importante aquí que en el ejercicio 7.16. 


EWN 


Pruebas de hipótesis 


8.1. Introducción 


En los capítulos precedentes se ha descrito la forma en que algunos modelos probabilísticos pueden usarse 
para representar situaciones del mundo real, y se ha mostrado cómo, variando las condiciones bajo las cuales 
se manifiesta un fenómeno, se generan diferentes distribuciones de probabilidad para las variables en estudio; 
por ejemplo, la Distribución Binomial y la Hipergeométrica. Si estamos dispuestos a suponer que un modelo 
probabilístico representa adecuadamente una situación dada, el siguiente paso es tratar de llegar a conclusiones 
sobre la estructura del modelo usando los datos; es decir, inferir sobre la población usando la muestra que se 
tiene. Una de las formas en que esto puede hacerse, es mediante una prueba de hipótesis. En su contexto más 
general, una hipótesis estadística es una aseveración sobre un modelo probabilístico, y una prueba de hipótesis es 
un método para decidir sobre la plausibilidad de esa aseveración, usando la muestra como guía. En este capítulo 
presentaremos la teoría sobre la que se asienta el procedimiento para probar una hipótesis estadística, y nos 
referiremos específicamente a pruebas de hipótesis en los modelos Binomial y Normal. Puesto que una vez que 
se ha adoptado uno de estos modelos las únicas constantes desconocidas son los parámetros de la distribución 
correspondiente, es natural presentar pruebas de hipótesis sobre los parámetros de dicha distribución. Es 
conveniente destacar, sin embargo, que una hipótesis estadística no necesariamente se refiere a un parámetro 
de una distribución de probabilidades. De hecho, en el capítulo 13 se estudiarán algunas pruebas de hipótesis 
que no se aplican de manera explícita a parámetros de una distribución. En este capítulo, a pesar de lo que se ha 
dicho, y para facilitar la presentación de los conceptos, discutiremos sólo pruebas de hipótesis sobre parámetros. 


ipótesis estadís ca es una aseveración sobre un modelo probabilístico. El procedimiento mediante 
l se juzga! la factibilidad de la hipótesis es una prueba de hipótesis. , 


8.2. Ideas básicas en una prueba de hipótesis 


Con objeto de presentar las ideas centrales en una prueba de hipótesis recurriremos a un ejemplo. Un individuo, 
que llamaremos Z, pretende tener percepción extrasensorial; es decir, proclama que puede prever el resultado 


> 


z 
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de un experimento aleatorio un número mayor de veces que el que cabría esperar por mero azar. Con objeto 
de poner a prueba su capacidad de percepción extrasensorial le proponemos el siguiente experimento: en un 
cilindro con una tapa removible colocaremos 5 fichas de idéntico peso y apariencia, cada una de ellas con uno 
de los dígitos 1, 2, 3, 4, 5. Después de colocarlas en el cilindro pondremos la tapa en su lugar y agitaremos 
vigorosamente el mismo con objeto de que las fichas se mezclen. Posteriormente extraeremos una de ellas y, 
sin permitirle que la vea, le preguntaremos cuál es el número que aparece. Dado este experimento es claro que, 
desde nuestro punto de vista, sólo hay dos resultados posibles: que acierte o que se equivoque. El hecho de que 
acierte apoyaría su aseveración, mientras que un error iría en contra de ésta. 


Tal como se ha presentado, el experimento no se presta a conclusiones de tipo estadístico. Como veremos en 
seguida ello se debe a que hasta el momento estamos manejando un modelo verbal de la realidad. El siguiente 
paso consiste en “traducir” esta formulación, generando un modelo probabilístico para nuestro experimento. En 
este caso es claro que tenemos un experimento Bernoulli donde, si llamamos éxito a un acierto de , el parámetro 
de la distribución es p, la probabilidad de un éxito. El propósito de nuestro trabajo es decidir sobre la magnitud 
de p, la cual, si profesamos ignorancia completa, puede tomar cualquier valor entre cero y uno. Con objeto de 
simplificar un poco nuestro problema, es necesario examinarlo más detenidamente. Nuestra tendencia natural, 
desde un punto de vista estrictamente científico, sería dudar de la afirmación de Z y presumir que trata de 
adivinar el número de la ficha. Traducido al lenguaje del modelo probabilístico, nuestra idea es que el valor de p 
en esa función de probabilidades es 0.2, o tal vez menos. Alternativamente, Z pretende que p es mayor que 0.2 
(la probabilidad de acertar por mero azar), puesto que sólo puede reclamar percepción extrasensorial si acierta 
un número mayor de veces que una persona tratando de adivinar. Tenemos entonces una partición natural del 
espacio de posibles valores para p. 


Los valores de p<0.2 corresponden a lo que podríamos llamar “nuestra hipótesis”, mientras que los valores 
de p>0.2 corresponden a “la hipótesis de Z”. Esta partición del espacio de valores del parámetro en dos 
conjuntos mutuamente excluyentes es un aspecto esencial en la prueba de una hipótesis. Es importante notar 
que la discusión anterior sólo es una ilustración de un hecho que debería ser obvio: a toda hipótesis corresponde 
otra hipótesis complementaria que es su negación. En este caso las dos hipótesis son: 


1) La probabilidad de que Z acierte es menor o igual que 0.2 p<0.2 
2) La probabilidad de que Z acierte es mayor que 0.2 p> 0.2 


Una de estas hipótesis será llamada la Hipótesis Nula, en tanto que su complemento será llamada la Hipótesis 
Alternativa. La notación que usaremos será Ho para la nula y Ha para la alternativa. 


Por razones que serán más evidentes a medida que se avance en la presentación, es importante decidir cuál 
de las hipótesis en cuestión será llamada la hipótesis nula. Por el momento solamente haremos la siguiente 
observación, y volveremos sobre el tema más adelante. 


De acuerdo con esta regla tendríamos, en nuestro ejemplo, el siguiente juego de hipótesis: 
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Ho: p<0.2 (Z no tiene percepción extrasensorial). 
Ha: p>0.2 (Z no tiene percepción extrasensorial). 


Una vez establecido nuestro juego de hipótesis podemos reexaminar nuestro problema para ilustrar otras 
características de una prueba de hipótesis. El experimento sólo tiene dos resultados cuyas probabilidades son: 


P [Éxito] = P 
P [Fracaso] = q4 = 1 — p 


Lo primero que vale la pena señalar es que, salvo en los casos triviales p=0 o p=1, ambos resultados 
pueden ocurrir independientemente de que Z tenga percepción extrasensorial o no la tenga. En lenguaje 
cotidiano esto quiere decir que el experimento no será concluyente, ya que un individuo sin percepción 
extrasensorial puede acertar, y un individuo con percepción extrasensorial puede fallar (a menos que su 
aseveración sea que no falla nunca, en cuyo caso la hipótesis alternativa sería p = 1.0). Es por este motivo que 
una hipótesis estadística es esencialmente diferente de una proposición matemática, ya que esta última puede 
ser demostrada concluyentemente, o refutada en su caso, mientras que en una hipótesis estadística, cualquiera 
que sea la decisión que se tome con respecto a su veracidad, la probabilidad de una decisión errónea siempre 
está presente. 


Volviendo al ejemplo que estamos discutiendo, es claro que podemos equivocarnos de dos maneras: decidiendo 
que Z tiene percepción extrasensorial cuando no la tiene y decidiendo que Z no tiene percepción extrasensorial 
cuando sí la tiene. Usando un lenguaje más formal, y refiriéndonos al juego de hipótesis establecido: rechazando 
Ho cuando es cierta, y no rechazando Ho cuando es falsa. En general, para cualquier juego de hipótesis se tienen 
las posibilidades que se presentan en la siguiente tabla. 


Situación real (desconocida) 


MAA Ho es cierta Ho es falsa 


Decisión Error (Llamado Error Tipo D) Decisión correcta 


tomada Decisión «correcta Error (Llamado Error Tipo II) 


El Error Tipo I consiste en concluir que el sujeto tiene percepción extrasensorial cuando no la tiene, y el Error 
Tipo II en concluir que no tiene percepción extrasensorial cuando sí la posee. 


La decisión que se tome dependerá del resultado del experimento. Es razonable creer que Z tiene percepción 
extrasensorial si acierta, y no creerlo si falla. Puesto que los dos resultados del experimento son posibles, 
independientemente del valor de p, lo que podemos evaluar es la probabilidad de cada uno de los tipos de error. 
La notación que se emplea casi universalmente es: & para la probabilidad de Error Tipo I y f para la probabilidad 
de Error Tipo II. 
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Debido a que el investigador desea cuantificar la evidencia para rechazar Ho, un concepto importante en una 
prueba de hipótesis es la probabilidad de rechazar una hipótesis dada. Puesto que esta probabilidad es una 
función del parámetro, la denotaremos por 0( p). Simbólicamente: 


9(p) = P [Rechazar Ho cuando el valor verdadero del parámetro es p]. 


Es claro, de lo discutido anteriormente, que para todos los valores de p en la hipótesis nula, ô( p) = probabilidad 
de Error Tipo I, mientras que para todos los valores de p en la hipótesis alternativa, 


9(p) = 1 — probabilidad de Error Tipo II. 


Puesto que Ó(p) es la probabilidad de rechazar una hipótesis dada, dependiendo del valor verdadero del 
parámetro, se le llama la función de poder (o de potencia) de la prueba. 


En seguida se ilustrarán estas ideas en el ejemplo que se ha venido discutiendo, pero antes es necesario presentar 
dos conceptos que, aunque obvios en este ejemplo, son muy importantes en la teoría general de pruebas 
de hipótesis. El primero se refiere a lo que llamaremos una Estadística para la prueba y el segundo a lo que 
llamaremos la Regla de decisión para la prueba. 
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En nuestro ejemplo, puesto que el experimento es muy sencillo, las reglas de decisión (razonablemente) posibles 
son muy pocas. La variable aleatoria X (Bernoulli) sólo puede tomar dos valores. Diremos que X toma el valor 
uno si Z acierta y el valor cero si Z no acierta. Tenemos, entonces: 


P(X=0)=4 
PX =1)=p 


Claramente lo razonable será rechazar Ho si X = 1 y no rechazarla si X = 0. La región de rechazo tiene entonces 
un punto (X = 1), y la región de no rechazo también está integrada por un punto (X = 0). 


Con esta regla de decisión tenemos: 


ô( p) = P [Rechazar Ho cuando el valor del parámetro es p] 
= P [X = 1, cuando el valor del parámetro es p] = p 


La función de potencia de la prueba en este caso es muy simple, y por ello es fácil comprender las siguientes 
observaciones: 


a) El valor máximo de d( p) en el espacio de valores de la hipótesis nula es 0.2. Por tanto, el valor máximo 
de la probabilidad de Error Tipo I es 0.2. Esto muestra que la probabilidad de Error Tipo I depende del 
valor del parámetro. De hecho, una notación más correcta sería escribir æ (p). 


b) Para valores grandes de p la prueba tiene poca capacidad discriminatoria. Concretamente, para p=0.6, 
ó( p)=0.6 . Esto quiere decir que si Z acierta el 60% de las veces, la probabilidad de rechazar Ho es de 
0.6. En otras palabras, que la probabilidad de Error Tipo II es 40%. Esto es grave porque indica que para 
un individuo que acierta el triple de las veces que acertaría un individuo cualquiera, tenemos un 40% de 
probabilidad de decidir que no tiene percepción extrasensorial. Es claro también que la probabilidad de 
Error Tipo II disminuye para valores de p cercanos a uno, y llegaría a ser cero si p toma el valor uno. Esto 
es típico de las pruebas de hipótesis que se estudiarán en este texto, pero en situaciones prácticas no tiene 
mucha importancia, ya que simplemente indica (en nuestro ejemplo) que es fácil reconocer percepción 
extrasensorial en un individuo omnisciente. 


al punto b) que acaba de discutirse, la conclusión es que nuestra prueba de hipótesis es poco 
y las razones serán analizadas después. Por lo que toca al punto 4), con objeto de referirnos a un 
del Error Tipo I, definiremos el Nivel de Significancia de una prueba de hipótesis. 
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En el ejemplo es claro que el nivel de significancia de la prueba es 0.2. La estrategia que se seguirá en una prueba 
de hipótesis consiste en fijar de antemano el nivel de significancia. La ventaja de este enfoque es que se sabe, con 
una prueba dada, la probabilidad máxima de rechazar una hipótesis nula que es cierta. 


En cuanto al problema planteado en el punto 6), es decir, la alta probabilidad de cometer un error del segundo 
tipo, una forma de mejorar nuestra capacidad de predicción es repetir el experimento varias veces, puesto que es 
claro que si Z acierta una proporción alta de un gran número de intentos, su aseveración estará mejor apoyada 
que si acierta en un solo intento. Con objeto de sustanciar esta aseveración consideramos en seguida el caso en 
que el experimento descrito se repite 10 veces. Si repetimos el experimento de mezclar las fichas en el cilindro, 
teniendo cuidado de que las 10 repeticiones sean independientes, tenemos que la variable que registra el número 
de veces que Z acierta seguirá una distribución Binomial, con parámetros 10 y p. Usando nuestra notación, si 
X es el número de veces que el examinado acierta, 


X- Bin(10, p) 


La distribución de probabilidades de X depende de manera obvia, del valor de Pp» o, dicho de otra forma, de la 
capacidad de percepción extrasensorial de Z. Puesto que sólo estaríamos dispuestos a rechazar la hipótesis nula 
si Z acierta más veces que las que acertaría alguien tratando de adivinar, tabularemos algunas probabilidades 
de X en la cola derecha de la distribución Binomial para diferentes valores de p. Estas probabilidades pueden 
obtenerse fácilmente de la tabla A al final de este libro. Para nuestros propósitos es innecesario incluir los valores 
k = 0, 1, 2 en la Tabla 8.1. 


Tabla 8.1. Probabilidades acumuladas de la distribución Binomial (10, p), en su cola derecha, para algunos valores de p. 


P(X>2) 


0.0011 
0.0128 
0.0500 
0.1209 
0.3504 


Ho 


0.6178 
0.8281 
0.9452 
0.9895 
0.9991 
1.0000 
1.0000 


* Valores menores que 0.0001 


ED. 
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Con esta tabla de probabilidades es sencillo analizar el comportamiento de los Errores Tipo I y Tipo II para 
diferentes reglas de decisión. Con propósitos ilustrativos únicamente se considerarán tres pruebas, es decir, tres 
diferentes reglas de decisión para el juego de hipótesis: 


Ho: p<0.20 en oposición a Ha: p>0.20 


Las tres pruebas se caracterizarán por sus regiones de rechazo. La estadística para la prueba será la variable 
aleatoria X distribuida Bin(10, p). En lenguaje cotidiano X es, por supuesto, el número de veces que Z acierta 
de un total de 10 intentos. Puesto que lo razonable es rechazar Ho si Z acierta un número “grande” de veces, 
las reglas de decisión pertinentes son del tipo: “rechazar Ho si X > k”. El valor de $ dependerá del nivel de 
significancia que se desee. Esa es la razón de que la palabra “grande” se haya puesto entre comillas líneas arriba. 
Las tres pruebas que se estudiarán en detalle son las que se muestran en seguida: 


AAA A A 
Prueba Regla de decisión Región de rechazo 


1 Rechazar HosiX23 R =(x|x=3,4,5,6,7,8,9,10) 
2 Rechazar HosiX>5  R,=(x|x=5,6,7,8,9,10) 
3 Rechazar Ho si X >8 R, =(x|x=8,9,10) 


El comportamiento de una prueba está caracterizado por su función de potencia. Para cada una de las pruebas 
la función de potencia correspondiente es: 


9, (p)= P [X> 3 cuando el valor del parámetro es p] 
9, (p)= P[X> 5 cuando el valor del parámetro es p] 
0,(p)= P [X > 8 cuando el valor del parámetro es p] 


Volviendo a la tabla de probabilidades calculada antes (Tabla 8.1), es claro que puntos de la función de poder 
para algunos valores de p están dados por las columnas k = 3, k = 5 y k = 8 para Ô}, Ô, y Ô, respectivamente. 
Si se desea examinar Ô( p) para otras pruebas, bastaría considerar las columnas respectivas de la tabla 8.1. Para 
discutir las 3 pruebas que hemos definido transcribiremos las 3 columnas relevantes de la tabla 8.1. 


Tabla 8.2. Funciones de poder para 3 pruebas de hipótesis. 


0.05 0.10 0.15 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 


ò (p) | 0.0116 0.0702 0.1798 0.3222 0.6172 0.8328 0.9453 0.9877 0.9985 0.9999 1.0000 1.0000 
9,(p) | 0.0001 0.0016 0.0099 0.0328 0.1503 0.3670 0.6230 0.8337 0.9527 0.9936 0.9999 1.0000 


ô; (p) i ii 0.0001 0.0001 0.0016 0.0123 0.0546 0.1672 0.3829 0.6778 0.9298 0.9884 


Usando la tabla 8.2 podemos discutir las propiedades de las tres pruebas. Los puntos importantes se analizan a 
continuación: 


T 
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a) 


b) 


c) 


En los tres casos el valor máximo de a: (p) se da para p = 0.2, siendo entonces 0(0.2)el nivel de 
significancia de cada una de las pruebas. Los niveles de significancia respectivos son 0.3222, 0.0328 y 
0.0001. Desde el punto de vista del Error Tipo I es claro entonces que la prueba más conveniente es la 
tercera. Que esta conclusión es errónea será claro en seguida, cuando se examinen las magnitudes de los 
Errores Tipo II para las diferentes pruebas. 


Supóngase que p = 0.6, es decir, que Z tiene una capacidad de percepción extrasensorial que le 
permite acertar el triple de las veces que si sólo tratara de adivinar el número en la ficha, es decir, 
que Z tiene una marcada percepción extrasensorial. La prueba número 1 tiene entonces una potencia 
de 0.9877, lo que equivale a decir que su Error Tipo II tiene una probabilidad de 0.0123 [recordar 
que d(p)=1—B(p) o B(p)= 1—ò(p) para valores de p en Ha]. La prueba número 2 tiene una 
potencia de 0.8337, o una probabilidad de Error Tipo II de 0.1663. Finalmente, la prueba número 3 
tiene para p = 0.6 una potencia de 0.1672 o una probabilidad de Error Tipo II de 0.8328. De modo 
que las pruebas con un nivel de significancia (máximo Error Tipo D alto, tienen menor Error Tipo 
II, mientras que las pruebas con nivel de significancia bajo tienen mayor Error Tipo II. La moraleja 
es que no es posible minimizar simultáneamente los dos tipos de error. La estrategia que usualmente 
se sigue, dado este fenómeno, se discutirá más adelante. Líneas arriba examinamos la situación para 
el valor p = 0.6, pero la conclusión obtenida es similar para otros valores de p, como es claro de la 
gráfica que se presenta en la Figura 8.1. 


El hecho de que el valor máximo de a(p) se obtiene para el valor de p que corresponde a la igualdad 
en la hipótesis nula es característico de las pruebas de hipótesis que se estudiarán en este texto. Por 
esta razón, la hipótesis nula invariablemente incluirá la igualdad, y el nivel de significancia se definirá 
como el valor de a( p) para el valor de p que corresponde a la igualdad en Ho. 


En la página siguiente se presenta la Figura 8.1, donde es evidente la interrelación entre los dos tipos de 


error. 


De acu 


erdo con la discusión anterior, cuyos aspectos sobresalientes se ilustran en la gráfica 8.1, concluimos 


que una prueba no puede elegirse considerando exclusivamente uno de los dos tipos de error, puesto que si 
una prueba tiene menor nivel de significancia que otra, invariablemente tendrá mayor probabilidad de Error 
Tipo II. El método que usualmente se sigue ante esta disyuntiva se detalla en seguida. 
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a, =0.0001 
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 


Figura 8.1. Funciones de poder y relación entre Error Tipo I y Error Tipo II para tres niveles de significancia. 


Volviendo a nuestro ejemplo, dado que nuestra convicción es que apoyaremos a la hipótesis nula (Z no tiene 
percepción extrasensorial), a menos que el experimento arroje evidencia concluyente en su contra, trataremos 
de fijar el Error Tipo 1 máximo en una cantidad baja. 


En el caso de la hipótesis que se ha usado como ejemplo, supóngase que se ha decidido que el nivel de significancia 
de la prueba no debe exceder al 4% (a < 0.04). Esta restricción elimina automáticamente a las pruebas cuyas 


reglas de decisión serían (ver Tabla 8.1): 


Rechazar Ho si X > 0 (a =1.0) 

Rechazar Ho si X 21 (a =0.8926) 
Rechazar Ho si X > 2 (a = 0.6242) 
Rechazar Ho si X > 3 (a =0.3222) 
Rechazar Ho si X > 4 (a = 0.1209) 


Las pruebas que cumplen con la restricción son aquéllas cuya regla de decisión es rechazar Ho si: 


X25 (a=0.0328) 
X26  (a=0.0064) 
X27 (a=0.0009) 
X28 (a=0.0001) 
X29 (a<0.0000) 
X210 (æ< 0.0000) 
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y, de acuerdo con la estrategia que se ha delineado, de estas pruebas se elegiría aquella que tenga menor Error 
Tipo II para los diferentes valores de p. Un examen cuidadoso de la tabla 8.1 muestra que la prueba cuya regla 
de decisión es “Rechazar Ho si X > 5” es la que maximiza la función de poder o equivalentemente minimiza 
las probabilidades de Error Tipo II para los diferentes valores de p, entre las pruebas con & < 0.04. 


Seleccionada la prueba de acuerdo con los criterios propuestos, sólo resta realizar el experimento (tomar la 
muestra) y elegir la decisión que corresponda. En este caso la prueba escogida es: 


Regla de decisión Nivel de significancia Región de rechazo 
Rechazar Ho si X >5 a = 0.0328 R=([x|x=5,6,7,8,9,10) 


Esto quiere decir que, una vez realizado el experimento, decidiremos rechazar Ho si Z acierta cinco o más veces, 
y no rechazar Ho si Z tiene cuatro o menos aciertos. 


Antes de proceder a generalizar estos conceptos y de aplicarlos a situaciones especiales es conveniente presentar 
la idea del Nivel Observado de Significancia de una Muestra. Para introducir este concepto considérese la prueba 
con regla de decisión “Rechazar Ho si X > 5” en el caso que ha servido de ejemplo, y supóngase que realizado 
el experimento encontramos que Z acierta cuatro veces; es decir, el valor observado de la variable aleatoria es 
X =4. Con la prueba elegida es claro que X É R, y la conclusión sería no rechazar Ho con æ = 0.0328. 
Sin embargo, si tomamos œ = 0.1209, correspondiente a la regla de decisión “Rechazar Ho si X > 4”, la 
decisión sería rechazar Ho con æ = 0.1209. Diremos entonces que el nivel observado de significancia (2) 
de la muestra es & = 0.1209. Para clarificar más la idea supóngase ahora que Z acierta ocho veces, es decir, 
que X = 8. Claramente entonces se rechaza Ho para la prueba con æ = 0.0328; pero también se rechaza Ho 
para las pruebas con reglas de decisión “X > 6 (a = 0.0064)”, “ X 2 7 (a = 0.0009)” y “ X >8(a=0.0001)”. 
Diremos entonces que el nivel observado de significancia de la muestra es & = 0.0001. 
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8.3. Clasificación de los diferentes tipos de hipótesis 


En la sección 8.2, con objeto de presentar de manera más o menos general las ideas básicas de una prueba de 
hipótesis, nos referimos exclusivamente a un tipo de hipótesis. Generalizando la situación ejemplificada allí, si 
O es un parámetro cualquiera y 0, es una constante en el conjunto de valores que puede tomar el parámetro, la 
hipótesis que discutimos fue de la siguiente forma: 


Ho: 0 < 0, en oposición a Ha: 0 > Op. 


Una característica de este juego de hipótesis es que tanto la hipótesis nula como la alternativa contienen más 
de un punto. Se dice entonces que la hipótesis que se prueba es compuesta en oposición a compuesta. Además, 
debido al hecho de que para este juego de hipótesis la regla de decisión generalmente es “Rechazar Ho si la 
estadística es mayor o igual que una cierta cantidad”, se dice que es una hipótesis de la cola derecha. Otras posibles 
combinaciones de interés práctico se exploran en seguida. 


1. Hipótesis simple en oposición a Hipótesis simple 


En este caso se tiene un parámetro O y dos valores 0, y O, (dos constantes) que son, de acuerdo con el 
experimentador, los únicos valores que puede tomar 6. El juego de hipótesis es: 


Ho: 0 = 0, en oposición a Ha: 0 = 0, 


El lector debe notar que si 0, > 0, se tiene una hipótesis de la cola derecha y si 0, < 0, se tiene una hipótesis de 
la cola izquierda, indicando que la regla de decisión generalmente será del tipo “Rechazar Ho si X (la estadística 
de prueba) es mayor o igual (menor o igual) que una constante”. En cualquier caso, los conceptos definidos en 
la sección 8.2 se aplican (simplificados) a esta situación. Los Errores Tipo I y II sólo se calculan para 0, y 0, y la 
situación es más sencilla que en el ejemplo discutido antes. 


2. Hipótesis Simple en oposición a Hipótesis compuesta 

En esta situación se tiene un valor 0, que el investigador considera importante. Los posibles juegos de hipótesis son: 
a) Ho: 0 = 0, en oposición a Ha: 0 > 0, 
b) Ho: 0 = 0, en oposición a Ha: 0 < 0, 
c) Ho: 0 = 0, en oposición a Ha:0 A 0, 


El caso a) es una simplificación del presentado en la sección 8.2. La simplificación consiste en que el Error Tipo 
I, ya que sólo se calcula en un punto, es igual al nivel de significancia de la prueba. Por lo demás es una prueba 
de la cola derecha. Por lo que toca a la situación bh) tenemos una hipótesis de la cola izquierda, que es simétrica 
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con la explorada en el caso a), y la única diferencia consistiría en la regla de decisión, que en este caso sería del 
tipo “Rechazar Ho si la estadística es menor o igual que una cierta constante”. El caso c) amerita consideración 
especial y será discutido en la sección 8.4. 


3. Hipótesis compuesta en oposición a Hipótesis simple 
Los posibles juegos de hipótesis serían: 

a) Ho: 0 < 0) en oposición a Ha : 0 = 0, (0, >0,) 

b) Ho: 0 > 0, en oposición a Ha: 0 = 6, (0, <0,) 


Esta situación sería simétrica con los casos a) y b) en (2), pero no se discute más ampliamente debido a su escasa 
importancia práctica. 


4. Hipótesis compuesta en oposición a Hipótesis compuesta 


Las situaciones de mayor importancia práctica pertenecen a esta categoría. De hecho sólo se discutirán en detalle 
los casos que caen en esta situación y el del inciso c) en (2). Los juegos de hipótesis posibles aquí son: 


a) Ho: 0 < 0, en oposición a Ha: 0 > 0, 
b) Ho: 0 > 0, en oposición a Ha: 0 < 0, 


El lector debe notar que el caso (4-a) se discutió ampliamente en la sección 8.2. Por lo que toca al caso 6), su 
manejo sería idéntico al caso 4), excepto que la prueba típica sería una prueba de la cola izquierda. 


La discusión anterior nos permite concluir que sólo el caso (2-c) requiere una discusión especial, puesto que la 
regla de decisión sería diferente, dando origen a lo que llamaremos una prueba de hipótesis de dos colas. A este 
caso nos referiremos en la siguiente sección. 


8.4. Una prueba de hipótesis de dos colas 


Para presentar las ideas que son características de este tipo de hipótesis es necesario recurrir a un ejemplo 
diferente del presentado en la sección 8.2. La razón es más profunda de lo que podría pensarse. No se trata sólo 
de dar un ejemplo “adecuado”, sino de destacar que tenemos un problema que emerge en una situación especial. 
Concretamente, el hecho de que la hipótesis nula sea simple (sólo contiene un punto) subraya la idea de que 
hay una opinión muy definida (por parte del investigador) del valor verdadero del parámetro. En la práctica 
esto ocurre generalmente en trabajos científicos de investigación básica, donde se trata de poner a prueba una 
teoría. Cualquier desviación de la muestra (en una dirección o en la otra) va en contra de la teoría propuesta. 
Por las razones expuestas, este tipo de hipótesis es muy importante si se usa correctamente, e irrelevante en caso 
contrario. Con estas ideas en mente, presentamos un ejemplo que nos permitirá discutir las peculiaridades de 
este tipo de hipótesis. 


Un genetista que estudia el mecanismo hereditario del color de la flor en una planta sostiene la teoría de 
que al cruzar dos tipos de dicha planta se obtendrán tres plantas con flores rojas por cada dos plantas con 
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flores blancas, es decir, sostiene que la proporción de plantas con flores rojas a plantas con flores blancas 
es 3:2. Si la evidencia experimental no apoya su aseveración, su teoría sobre el mecanismo hereditario no 
se sostendrá. Para poner a prueba su hipótesis el genetista realiza 20 cruzas y observa los resultados en las 
20 plantas obtenidas (una muestra de tamaño 20 sería muy pequeña para este experimento, pero se elige 
aquí simplemente para poder usar la Tabla A). “Traduciendo” a lenguaje estadístico, tenemos de nuevo 
repeticiones de un experimento Bernoulli. Si llamamos éxito a obtener una planta con flores rojas y fracaso a 
obtener una planta con flores blancas, entonces la variable X, definida como el número de plantas con flores 
rojas en los 20 intentos, tiene una distribución Binomial con parámetros 20 y p. La hipótesis estadística 
sería: 


Ho: p = 0.60 en oposición a Ha: p # 0.60 
ya que el hecho de que 3 de cada 5 plantas tengan flores rojas es equivalente a decir que el 60% las tienen. 


En el caso de una hipótesis de dos colas es claro que la hipótesis alternativa será apoyada por la muestra 
tanto si se tienen muchos éxitos como si se tienen muy pocos. Es decir, que se tiene una región de rechazo 
formada por valores extremos en la cola derecha y en la cola izquierda de la distribución de la estadística bajo 
la hipótesis nula. 


De acuerdo con lo anterior, valores de X cercanos a 20 o cercanos a cero apoyan la hipótesis alternativa. Para 
aclarar el significado de la expresión “valores extremos” es necesario fijar el nivel de significancia que se desea. 
Con ese fin presentamos probabilidades acumuladas en los dos extremos de la distribución Binomial (20,0.6). 
Estos valores son fácilmente obtenibles de la Tabla A. 


Tabla 8.3. Valores acumulados de probabilidad en las dos colas de la Distribución Binomial (20, 0.6). 


13 14 15 16 17 18 19 


0.4158 0.2499 0.1255 0.0509 0.0159 0.0036 0.0005 


1 2 3 4 5 6 
0.0000 0.0000 0.0000 0.0000 0.0003 0.0016 0.0065 


Para nuestros propósitos es suficiente con las probabilidades desplegadas en la Tabla 8.3. Supongamos que se ha 
decidido que el nivel de significancia de la prueba sea menor del 4%, es decir, œ < 0.04 . Esto quiere decir que 
la probabilidad de rechazar Ho cuando p = 0.6 debe ser menor o igual que 0.04. 


Puesto que la región de rechazo estará integrada por valores extremos en las dos colas de la distribución, es fácil 
imaginar muchas situaciones en que las regiones de rechazo en ambas colas pueden elegirse de varias maneras, 
todas ellas cumpliendo con la restricción impuesta por el nivel de significancia. La regla que se sigue es elegir 
valores c, y c, de manera que, bajo Ho, P(X > c,) sea aproximadamente igual a P(X < c, ). La regla usual 
trata de hacer exactamente iguales estas probabilidades. Sin embargo, ello no es fácil de conseguir, a menos 
que la distribución de la estadística de prueba bajo la hipótesis nula sea simétrica. El lector podrá verificar ésto 
en un ejercicio al final del capítulo. En el caso de la Binomial, debe recordarse que la distribución es simétrica 
si p=0.5 (ver Figura 6.2 c). En esta discusión se eligió deliberadamente un valor de p (bajo Ho), que genera 
una distribución asimétrica, para prevenir al lector sobre los problemas que encontrará en la práctica. 
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Dadas estas observaciones es fácil comprobar que una prueba que cumple con la restricción especificada por el 
nivel de significancia, y que vuelve aproximadamente iguales las probabilidades de rechazo bajo Ho en las dos 
colas, es la determinada por la regla de decisión: 
“Rechazar Ho si X 217 osi X <7”, es decir, que c, = 17 y c, = 7. Con dicha regla, si definimos 

R, = {x |x =17,18,19,20} 

R, ={x|x=0,1,2,3,4,5,6,7} 


La región de rechazo está dada por: 


R=RUR, 


donde claramente R, NR, =p 
El nivel de significancia es: 


a=P(XER|p=0.6) 


que debe leerse como: “la probabilidad de rechazar Ho cuando p = 0.6”, es decir, cuando la hipótesis nula es 
cierta. Debido a que R = R UR, y R NR), = 6, esto es equivalente a: 


a=P(XER|p=0.6)=P(XER |p=0.6)+P(X ER, | p=0.6) 
=P(X=17|p=0.6)+P(X <7|p=0.6) 
=0.0159+0.0211= 0.0370, 


como puede verificarse usando la tabla 8.3. Dada la asimetría de la distribución, esto es lo más que podemos 
hacer para que la probabilidad de rechazo sea aproximadamente igual en las dos colas de la distribución. 
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Antes de continuar nuestra discusión sobre una prueba de hipótesis de dos colas, es interesante recalcar el 
siguiente hecho. La regla de decisión consiste en rechazar Ho si X 217 osi X <7. Dado que el valor esperado 
de la estadística de prueba bajo la hipótesis nula es 12, los dos puntos límite para el rechazo son equidistantes 
de este valor esperado. En efecto, cuando se impone la restricción de que las probabilidades de rechazo en las dos 
colas sean aproximadamente iguales, se quiere que la prueba resultante tenga este tipo de simetría. Puesto que dada la 
hipótesis nula del investigador el valor esperado es npọ, una desviación de un cierto número de unidades en exceso es 
tan grave como esa misma desviación en número de unidades por defecto. 


Una vez determinada la prueba es conveniente analizar la función de poder de la misma. Para no alargar 
innecesariamente la presentación sólo se estudiará la función de poder de la prueba descrita. El lector puede 
verificar que si elige una regla de decisión con menor nivel de significancia que el de la prueba escogida, se tendrá 
una función de poder con mayores probabilidades de error del segundo tipo, mientras que si se elige una regla 
con mayor nivel de significancia, la prueba resultante dará menores probabilidades de Error Tipo II. Con la 
prueba que se ha elegido, la función de poder es: 


9(p)=P (Rechazar Ho] p) =P (X 217| p)+ P(X 571 p) 


Con objeto de graficar O( p) se presenta la Tabla 8.4. 


Tabla 8.4. Cálculo de la función de potencia para una prueba de dos colas. X ~ Bin(20, p). œ = 0.0370 


Ho: p=0.6 en oposición a Ha: PX 0.6 
0.2 0.3 0.7 0.8 0.9 


P(X 217) 0.0000 0.0000 0.0000 0.0000 0.0013 0.0159 0.1070 0.4114 0.8671 0.9842 


P(X <7) 0.9997 0.9678 0.7722 0.4158 0.1316 0.0211 0.0012 0.0000 0.0000 0.0000 


ò(lp)= P(X 217) 
0.9997 0.9678 0.7722 0.4158 0.1329 0.0370 0.1082 0.4114 0.8671 0.9842 
+P(X <7) 


La curva de potencia correspondiente se presenta en la Figura 8.2. Las diferencias con la curva de una prueba 
con alternativa de una cola son evidentes. En este caso, puesto que la hipótesis nula sólo contiene un punto, el 
Error Tipo I se comete sólo en ese punto y su probabilidad es el nivel de significancia, que es el valor mínimo 
de ô( p). La probabilidad de Error Tipo II disminuye a medida que el valor del parámetro se aleja del valor 
propuesto en la hipótesis nula. Así, $(0.4) = 0.5842 y B(0.2) = 0.0322. Por último, notamos que la curva de 
potencia no es simétrica. Esto se debe a que bajo Ho, X ~ Bin(20,0.6), y esta distribución no es simétrica, El 
lector puede (debe) verificar que si se prueba el juego de hipótesis Ho: p=0.5 en oposición a Ha: p # 0.5, 
entonces es posible elegir conjuntos R, y R, en la cola derecha y en la izquierda, respectivamente, tales que: 


P(X ER | p=0.5)= P(X ER, | p=0.5)=a/2 


y entonces: 


P(XER|p=0.5)=P(XER|p=0.5)+P(XER,|p=0.5)=a 
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0(0.6)=0.0370=« 


Figura 8.2. Curva de potencia para la prueba de hipótesis Ho: p=0.6 en oposición 
a Ha: P%0.6, con a = 0.0370, en la distribución Binomial(20, p). 


8.5. Sistematización del método para realizar una prueba de hipótesis 


Las ideas que se han discutido en las secciones anteriores pueden generalizarse para ser aplicadas a cualquier 
modelo probabilístico, no sólo al modelo Binomial. A continuación se presenta una secuencia de pasos para 


probar 


L, 


una hipótesis estadística. Estos son: 


De acuerdo con las suposiciones que se hagan sobre el fenómeno y con la forma en que se han obtenido 
los datos, se elige un modelo probabilístico bajo el cual se operará. 


En el modelo probabilístico elegido se identifica el parámetro sobre el cual se desea inferir con base en la 
muestra. En el contexto de pruebas de hipótesis, el término parámetro se usará con más amplitud que la 
que le hemos dado. Por ejemplo, la mediana será un parámetro, aun cuando no aparezca explícitamente 
en una función de probabilidades. 


Se decide de qué tipo será el juego de hipótesis que se probará (simple en oposición a simple, compuesta 
en oposición a compuesta, de una cola, de dos colas, etc.). En la práctica, los juegos de hipótesis más 
útiles son: 


a) Ho: 0 < 0, en oposición a Ha: 0 > 6, 
b) Ho: 0 > 0, en oposición a Ha: 0 < 0, 
c) Ho: 0 = 0, en oposición a Ha : 0 # 0,, 


donde 8 es el parámetro sobre el que se quiere inferir y 0, es una constante elegida por el experimentador 
y que pertenece al conjunto de valores posibles para el parámetro 6. Por ejemplo, si O es la varianza de 
una variable, 0, es un valor necesariamente mayor o igual que cero. 
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4. Se elige una estadística de prueba. Forzosamente la distribución de la estadística (variable aleatoria) 
depende del parámetro 0, ya que esto es lo que nos permite discernir cuáles valores de la estadística 
son plausibles bajo Ho y cuáles no. Recalcamos que la distribución de la estadística depende de 0, pero 
la estadística en sí misma no es una función de 0, pues en ese caso no podríamos calcular su valor en 
una muestra dada, y no podríamos tomar una decisión basándonos en ella. Para aclarar la situación 
recordemos las pruebas presentadas en las secciones 8.2 y 8.4. La estadística usada fue X, una variable 
aleatoria binomial. Puesto que X ~ Bin(n, p), la distribución de X depende de p pero su valor en una 
muestra dada no depende de p. Ahora, puesto que 2 es conocido, X /n también podría usarse como 
estadística (y en ocasiones se usa), pero X — p no es una estadística. 


5. De acuerdo con la distribución probabilística de la estadística de prueba, se selecciona una regla de 
decisión que define una región de rechazo, la cual está integrada por valores de la estadística que son 
improbables bajo Ho. El conjunto de valores que integran la región de rechazo está constreñido por 
el nivel de significancia que se desea para la prueba. De hecho, el nivel de significancia se elige antes 
que la región de rechazo. Lo único que sugiere el orden en que hemos presentado las ideas es que la 
región de rechazo (o más bien su localización en la distribución de probabilidades de la estadística) se 
determina por los valores que son improbables bajo Ho. Recuérdese que si la hipótesis nula es compuesta, 
la probabilidad del Error Tipo I es una función del parámetro, y debemos localizar su valor máximo para 
los valores de Ho con objeto de determinar el nivel de significancia. Para las pruebas que se estudiarán 
en este texto, sin embargo, es suficiente que la hipótesis nula contenga la igualdad, y entonces el valor de 
a(0) para esa O será el nivel de significancia de la prueba. 


6. Una vez que la regla de decisión y su correspondiente región de rechazo han sido elegidas, sólo resta 
calcular el valor de la estadística de prueba en la muestra que se tiene y determinar si pertenece al 
subconjunto de su espacio muestral en la región de rechazo o a la región de no rechazo. La decisión 
que se toma entonces es como sigue: si el valor de la estadística está en la región de rechazo, decimos que la 
hipótesis nula se rechaza con un nivel de significancia (máxima probabilidad de rechazarla falsamente) æ. Si 
el valor de la estadística en la muestra está en la región de no rechazo, decimos que Ho no se rechaza al nivel 
de significancia establecido. En ningún caso concluimos que Ho es cierta o es falsa. En particular, si Ho no 
se rechaza, la interpretación es que la evidencia de la muestra no es suficiente para rechazarla con el nivel de 


significancia elegido. 


Los siguientes comentarios no se refieren a pasos que necesariamente se sigan al realizar la prueba de una 
hipótesis, pero es conveniente presentarlos aquí. El primero se refiere al comportamiento de la función de 
potencia de una prueba. En general, es conveniente estudiar dicha función; sin embargo, para las pruebas que se 
presentarán en este texto, dado un nivel de significancia la prueba que se recomienda tiene características óptimas 
con respecto a la probabilidad de Error Tipo II, comparada con las otras pruebas disponibles que mantienen ese 
nivel de significancia, por lo que no se analizará la función de potencia. El segundo comentario se refiere al nivel 
observado de significancia de una muestra. En una prueba cualquiera, no importa el valor de la estadística, siempre 
es posible rechazar Ho si se toma & suficientemente grande. El nivel observado de significancia de una muestra 
(2) se ha definido como el mínimo valor de & para el cual se rechazaría Ho dada una muestra. Claramente, 
mientras menor sea el valor de &, mayor es la evidencia en contra de Ho. Por lo anterior es conveniente 
reportar & en cualquier experimento. Para citar un caso concreto: suponga que con & =0.05 no se rechaza 
una hipótesis, pero para esta muestra & = 0.052. Esto quiere decir que si estamos dispuestos a tolerar una 
probabilidad máxima de Error Tipo I de 0.0521, rechazaríamos Ho. Para un investigador que lee un reporte, el 
valor de & es entonces muy importante. 
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8.6. Pruebas de hipótesis sobre la media de una distribución Normal 


Dada la importancia de la Distribución Normal, no es sorprendente que se discuta de manera explícita la forma 
de probar hipótesis sobre sus parámetros. En esta sección se presentan pruebas de hipótesis sobre la media. 
Posteriormente se estudiarán pruebas de hipótesis sobre la varianza. Para centrar la discusión especificamos la 
situación que se estudia. 


Se tiene una muestra aleatoria X, X»... X, de una distribución que se supone Normal con media u y varianza 


. . . . 2 . . . 
o”. Esto quiere decir que cada una de las variables aleatorias es N ( 1,0 ), y que las variables son independientes. 
Queremos inferir sobre el parámetro u de la distribución empleando para ello la muestra que se tiene. Los juegos 
de hipótesis de interés práctico son de tres tipos: 


a) Ho:u S Uy en oposición a Ha: u > Uy 
b) Ho: u > Uy en oposición a Ha: u < Uo 
c) Ho: u = Uy en oposición a Ha: u # Uy, 


donde 4o es una constante elegida por el investigador. 


En la búsqueda de una estadística de prueba para estas hipótesis es natural pensar en X , la media muestral de 
las observaciones, puesto que X es el homólogo muestral del parámetro 4. Tratando de encontrar regiones de 
rechazo razonables para cada juego de hipótesis, es conveniente recordar que en una muestra de una distribución 
normal con media 4 y varianza 0°: 


X ~ Nl(uo? In) 


y, por consiguiente, los valores de X tenderán a estar concentrados (con probabilidad alta) alrededor del valor 
de u. Para simplificar un poco la presentación nos referimos primero al juego de hipótesis a). En ese caso es claro 
P jueg p 
que valores “grandes” de X apoyan a Ha en detrimento de Ho. De manera quizá más evidente, valores positivos 
de X — Uo apoyan a Ha, en tanto que valores negativos de X — Uo apoyan a Ho. De cualquier modo, una regla 
o apoy 8 0 y g 
de decisión razonable es de la forma: 


“Rechazar Ho si X >c” 


donde c es una constante que debe elegirse de manera que el nivel de significancia de la prueba sea el deseado 
por nosotros. Si ese nivel es 2, debemos tener: 


P(X z¢| u= u)=8 (8.1) 


y la región de rechazo es: 


R=1(3|x>c) 
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Esta forma de la región de rechazo nos dice meramente de qué tipo es dicha región (de la cola derecha), pero 
no cuál es el valor de c. Para determinar dicho valor es necesario considerar que si bien X ~ N (u,0? / n), bajo 
Ho se tiene que X ~ N ( 1,07 | n) y esta es la distribución que se requiere para fijar el nivel de significancia. 
Puesto que c debe ser tal que: 


P(XER|u=u,)=4 


c debe elegirse, de acuerdo con (8.1) y (8.2), de modo que: 


SEa " hemla 


P(X =c|u=m)=P p 


Va(X- 


. Mo) . e ; 
, puesto que la variable estandarizada Z, = ——————— tiene una distribución normal estándar, se trata de 
y, P 0 ps 
encontrar c tal que: 


(8.3) 


La notación Zo se usa para destacar que Zo ~ N(0,1) si 4 = Mo. Con la notación del capítulo 6 es claro que: 


Vn (cp) 


O 


y despejando c se obtiene: 


O 
E 


La regla de decisión que da el nivel de significancia deseado es entonces: 
> a 
Rechazar Ho si X 2 Uy A 
n 
Alternativamente, es claro que la regla puede escribirse: 
Rechazar Ho si Zo = ————— 2 Za 


Aparentemente el problema está resuelto para el juego de hipótesis 


Ho: u S ug en oposición a Ha: u > Uy 
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Sin embargo, examinando la región de rechazo para la estadística X , encontramos que está definida por: 


O 


R=4xlu,+ 2 <X<O 
| o e a 


y el valor inferior en esa región puede calcularse sólo si ø es conocida (Za está determinado por el nivel de 
significancia deseado, 4g es el valor máximo de u bajo Ho y n es el tamaño de muestra). Si decidimos usar 
Zo, encontramos de nuevo que su valor en una muestra sólo puede calcularse si ø es conocida y, por lo 
tanto, Zo no es una estadística. Suponer O conocida es completamente irrazonable, lo más que podemos 
tener es el valor de S calculado en la muestra, y una solución posible es sustituir O por S en la expresión 
para Zo, o en el área de rechazo cuando se usa X. El problema que se presenta inmediatamente es que la 
variable aleatoria: 


Vn (X= uy) 
5 


no sigue una distribución normal, y el valor Z„ no nos da el nivel de significancia deseado. Este tipo 
de consideraciones fueron las que llevaron a W. S. Gossett (“Student”) a investigar la distribución de 
Án(X — 1)/S. Como ya se indicó en el capítulo 7, la distribución resultante es la que lleva el nombre de + 
de Student o simplemente +, y la cual se presenta en la Tabla E. 


De lo que se estudió en el capítulo 7 sabemos que, bajo Ho: 


z Vn (X-u) 


a S u E 


Por lo que la regla de decisión que garantiza el nivel de significancia deseado es: 


n(X—-u 
Rechazar Ho si t} = Je = 2-1) 


Equivalentemente, la regla de decisión puede expresarse en función de la estadística X: 


William Sealy Gosset 
1876-1937 


Rechazar Ho si X > ug + 


2 El 1) 
a n— 
Án a 


La prueba resultante recibe el nombre, (por razones obvias) de prueba de t, mientras que la que se usaría si O fuese 
conocida recibe el nombre de prueba de Z. El lector debe recordar que las diferencias entre la distribución de Z y la 
de t son más marcadas cuando los grados de libertad en la distribución de t son escasos (es decir, cuando la muestra 
es pequeña). Cuando se tienen muchos grados de libertad las probabilidades son prácticamente iguales en las dos 
distribuciones. Por esta razón algunos autores llaman a la prueba de Z una prueba para muestras grandes ya la 
prueba de t una prueba para muestras pequeñas. La idea es que más allá de un cierto número de grados de libertad no 
importa cuál de las dos pruebas se use, aunque debemos recalcar que la prueba estrictamente correcta es la de t, y debe 


usarse siempre que se disponga de tablas de esa distribución. El consenso actual es que 30 o más grados de libertad ya 
permiten usar la distribución de Z. 


Antes de considerar los juegos de hipótesis b) y c) para 4 en una distribución normal, se presentará un ejemplo 
para el juego de hipótesis a) que ya se ha discutido. 


Ejemplo 8.1. En una región agrícola se siembra predominantemente una variedad de trigo que tiene un 
rendimiento medio de 3.5 toneladas por hectárea. Una compañía productora de semillas ha desarrollado una 
nueva variedad y pretende que el rendimiento promedio es mayor que en la variedad comúnmente usada. 
Para probar esta aseveración se siembran nueve lotes experimentales con la nueva variedad, y se obtienen los 
siguientes rendimientos (en toneladas por hectárea): 


3.15, 3.92, 4.26, 3.36, 3.72, 4.19, 3.42, 4.38, 4.50 


Puesto que a menos que la nueva variedad muestre una diferencia positiva a su favor no cambiaremos de 
variedad, el juego de hipótesis es: 


Ho: u <3.5 en oposición a Ha: u > 3.5 


La suposición básica que haremos es que la variable aleatoria que representa el rendimiento de la nueva variedad 
. . . ., . . 2 

tiene una distribución normal con media y y varianza g”. La prueba adecuada es una prueba de ż de la cola 

derecha. Para calcular la estadística necesitamos los valores de X y S en la muestra. Con estos datos: 


X =3.878; S = 0.4895 


La estadística f es, entonces: 


.878—3.50 
yy = 290:878-3:50) T ) 2.317 
0.4895 


Supóngase que se desea un nivel de significancia del 5%, es decir, æ = 0.05. Para usar la regla de decisión 
correspondiente requerimos el valor de %,05(8). De la Tabla E obtenemos +,05(8)=1.860. La regla de 
decisión es “Rechazar Ho si tọ >t,(n—1)”. En este caso tọ =2.317 y tą(n—1)=1.860, por lo que la 
decisión es: se rechaza Ho con un nivel de significancia del 5%; esto es, con 4=0.05 la muestra apoya la 
aseveración de la compañía productora. Alternativamente, la regla de decisión usando la estadística X es: 


Rechazar Ho si X > uo +(S/Vn)r,(n—1. En este caso: 


0.48 
u, +(S/Vn)1,(n—1)=3.5+ o (1.860) = 3.8035 


por lo que la región de rechazo es R = {x | ¥ > 3.8035). Si se considera que X= 3.878 , la decisión es, por 
supuesto, la misma que antes. En cuanto al nivel observado de significancia, es difícil calcularlo con exactitud 
en una prueba de +, ya que las tablas usuales sólo proporcionan las abscisas para unos cuantos valores de 
probabilidad. Sin embargo, en este ejemplo podemos aproximarlo. En la Tabla E no encontramos (para ocho 
grados de libertad) el valor 2.317, pero para 2.306 se lee: 
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P(t) > 2.306) = 0.025, 


por lo que el nivel aproximado de significancia de la muestra es 0.025, es decir & =0.025. Con cualquier 
valor de æ mayor que 0.025 rechazamos Ho con esa muestra. Por esa razón se rechazó Ho con a = 0.05. Puede 
verificarse que Ho no se rechaza con 4=0.01 ni con a = 0.005. 

Para que el lector tenga una idea de los errores que se cometen usando la tabla de Z en vez de la tabla de t, que 
es la correcta, el valor Z9 005 es 1.645, por lo que con æ = 0.05 la conclusión sería la misma que con la prueba 


de +. Sin embargo, el nivel observado de significancia es: 


P(Z > 2.317) = 0.0103, 


contra 0.0250 con la distribución correcta. 6 
En seguida nos referimos al juego de hipótesis 5): 
Ho: u > Uy en oposición a Ha: u < uy 
y ahora, razonando análogamente a como lo hicimos en el juego a) de hipótesis, la regla de decisión adecuada 


es de la forma: Rechazar Ho si X < c. Para determinar el valor de c es suficiente fijar el nivel de significancia. Si 
ese nivel es æ, se desea que: 


P(X<c|u=u,)=a 


Equivalentemente, estandarizando la variable X se tiene: 


p E) Ha 


< —__T- 


O O 


Vn(X — uy) 


De nuevo, haciendo Z} = O i. Zo ~ N(0,1) bajo Ho, por lo que se quiere que: 


fac). 


Y, por tanto: 


de donde: 
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O 
T S 


j or? x n a 
y la regla de decisión que garantiza un nivel æ de significancia es: Rechazar Ho si X en Ms 
Alternativamente puede expresarse en función de Z} como: ús 


Vn(X — uo) 


Rechazar Ho si Z) = —— <S -Zg 


De nuevo el uso de la tabla de Z requeriría conocer el valor de ø. La solución es recurrir a la distribución de +, la 
cual también es simétrica, por lo que la regla de decisión usando X como estadística de prueba es: 


5 S 
Rechazar Ho si X < Ug ——=t,(n—1) 
Mo Nm a 


y usando la estadística X estandarizada: 


Vn(X— uy) 
S 


Rechazar Ho si tọ = =-2 im 1) 


Ejemplo 8.2. Los propagandistas de cierta marca de cigarrillos sostienen que el contenido promedio de nicotina 
de su producto es menor de 0.7 miligramos por cigarrillo. Suponiendo una distribución normal para el contenido 
de nicotina, su aseveración es que 4 < 0.7. Queremos entonces probar: 


Ho: 120.7 en oposición a Ha: u < 0.7 
La hipótesis se quiere probar con un nivel de significancia de 4=0.01 ya que si se rechaza Ho deberemos 
autorizar que en la publicidad aparezca esta afirmación, y sólo estamos dispuestos a hacerlo si la evidencia en 


contra de Ho es sustancial. Para realizar la prueba determinamos el contenido de nicotina de 30 cigarrillos, 
encontrando los siguientes valores: 


072, 076 068; 069 873 0155 070, 071, 
0.62, 0.68, 0.75, 0.73, 0.62, 0.64, 0.76, 0.74, 
0.60, 0.61, 0.61, 0.60, 0.69, 0.70, 0.78, 0.81, 
0.64, 0.63, 0.65, 0.79, 0.77, 0.76 


La media y la desviación estándar de las observaciones son: 


X =0.6920; S =0.0653 


Para A = 0.01, con 29 grados de libertad encontramos en la Tabla E: tọ (29) = 2.462, por lo que rechazaremos 
con Ho sólo si tọ < — 2.462. El valor de ż en la muestra es: 


Tg 
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les 1/30(0.6920—0.7) SO 


2 0.0653 


La región de rechazo es: 


R = {ty | 1) < —2.462} 


Puesto que to É R, la decisión es que no se rechaza Ho, con un nivel de significancia æ = 0.01. Nuestro 
experimento contradice (con & = 0.01) la afirmación de los propagandistas. Gráficamente esto se ilustra en la 
Figura 8.3. 


too (29) =-2.462 


Figura 8.3. Región de rechazo para una prueba de £ con 29 grados de libertad æ = 0.01. 


El nivel observado de significancia de la muestra es: 


A 


a = P (tog, £ —0.671) = P (tog) = 0.671) = 0.2538 


Es decir, que para rechazar Ho con esta muestra tendríamos que estar dispuestos a tolerar una probabilidad de 
Error Tipo I de al menos 25.38%. 


Si en este caso se usara una prueba de Z, el nivel observado de significancia sería: 


&= P(Z < —0.671) = 0.2514 


Aquí puede notarse que el error que se cometería por usar la distribución equivocada sería mucho menor que en 
el ejemplo 8.1. Esto se debe a que aquí se tienen 29 grados de libertad contra sólo 8 en el ejemplo anterior. 4 
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Para finalizar esta sección consideramos el juego (c) de hipótesis: 
Ho: u = Uy en oposición a Ha: UA Uy 
En este caso tanto valores grandes como pequeños de X apoyan la hipótesis alternativa. Siguiendo la línea de 


razonamiento que ya se expuso, y refiriéndonos exclusivamente a la prueba de +, es fácil verificar que una prueba 
que garantiza un nivel de significancia æ está especificada por la regla de decisión: 


Rechazar Ho si X > Uy + (S/n), (11) O si: 
X < m (S/n), (11) 


Vi(X= 40) 
Ed, 


O, usando la estadística 1, = 


Rechazar Ho si t, 2 tan (n—1)o tọ € —tan(n— 1) 


En general, en cualquiera de los tres juegos de hipótesis es más sencillo usar la estadística tọ, ya que entonces el 
valor límite —o los valores límite en el caso c)— de la región de rechazo se leen directamente de la Tabla E. En 
el juego de hipótesis c), la regla de decisión tiene una expresión más compacta que la dada arriba, puesto que 
puede escribirse: 


Rechazar Ho si | tọ |2 tan(n—1) 


Nótese que la región de rechazo R, al igual que en la prueba de dos colas en la sección 8.4, está integrada por la 
unión de dos conjuntos mutuamente excluyentes, a saber: 


R = {r | to Z tan(n—1)} 


R, = {t |t $ =tan(n—1)} 


Donde: 
P(to ER |1=4p)=a/2 
P(t ER, |u = u)=a12 
La región de rechazo es R = R, UR), donde R, N R, =$; por lo que: 


P(t ER| u= uo)= P(t ER |u = uo)+ P(t ER, |u = uo) 
=0a/2+0a0/2=0a 


En el caso de una prueba de ż (o de una prueba de Z), los conjuntos R} y R, pueden escogerse de igual 


probabilidad, ya que tanto la distribución de £ como la de Z son simétricas. 
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Ejemplo 8.3. En un experimento para determinar los grados centígrados necesarios para llevar al punto de 
ebullición un litro de agua en una localidad se realizan 14 intentos, obteniéndose los siguientes resultados: 


100.2, 100.1, 99.3, 99.2, 99.8, 100.7, 98.9, 
100.3, 100.2, 99.7, 99.6, 99.8, 100.3, 99.6 


Se quiere probar la hipótesis: 
Ho: u =100 en oposición a Ha: u#100 
con & = 0.02. Con los datos de la muestra: 


X =99.836; S =0.497:n=14 


La estadística £, para la prueba es: 


, = V14(99.836—100) ceca 
i 0.497 i 


De la Tabla E obtenemos +, ,1(13)= 2.650, por lo que se rechaza Ho para los valores de tọ mayores que 2.650 
o menores que —2.650. Es decir: 


R = {t | to >2.650 o ty <—2.650) 


Puesto que t) É R, no se rechaza Ho con a = 0.02. La conclusión en palabras es que dada la evidencia, y 
con œ = 0.02, no hay razón para creer que la temperatura de ebullición del agua bajo las condiciones del 
experimento es diferente de 100 °C. 


En este caso también puede usarse X como estadística. La región de rechazo para X es: 
tos S a S 


En este ejemplo se tiene: 


R = {F | ¥ >100.352 o y < 99.648) 


Gráficamente, la región de rechazo se presenta en la Figura 8.4. 
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x =99.648 x =100.352 


R, R R 
Figura 8.4. Región de rechazo para una prueba de hipótesis de dos colas sobre 4 en 
la Distribución Normal (a = 0.02). 
En la figura es claro que Y E R° (¥ = 99.836), y de allí la conclusión de rechazar Ho. El nivel observado de 


significancia es 4= 0.1202, 4 


A continuación resumimos los detalles que son característicos en una prueba de hipótesis sobre 4 en una 
distribución Normal. 
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8.7. Pruebas de hipótesis sobre la varianza de una distribución Normal 


El otro parámetro que aparece explícitamente en la función de la distribución Normal es g”. La importancia 
de O” debería ser obvia, puesto que es una medida de la variabilidad del fenómeno representado por el modelo. 
Como un ejemplo considérense dos variedades de una planta con el mismo rendimiento medio, pero una 
de las cuales tiene rendimientos muy uniformes y la otra se comporta de manera extrema bajo diferentes 
circunstancias. O considérese el caso de un estudiante cuyo promedio en los cursos es de 70, obteniendo en 
ocasiones calificaciones de 50 y en otras de 100. Es claro que sería preferible que sólo obtuviera calificaciones 
cercanas a 70. Esto no quiere decir que siempre sea deseable tener poca varianza. En el primer caso, el de las 
variedades, un genetista que practique ciertas técnicas de selección preferiría la variedad con mayor varianza. 
De cualquier modo, es claro que es deseable disponer de técnicas para probar hipótesis sobre la varianza de una 
población. La discusión la presentaremos de nuevo considerando tres juegos posibles de hipótesis. Sea 0% un 
número mayor que cero. Los juegos de hipótesis de interés son: 


a) Ho:0* <0; en oposición a Ha: 0? > 0; 


A iaia 
b) Ho:0” >0; en oposición a Ha :0° < 0o? 
E, az Z PETE. 
c) Ho:0° =0\ en oposición a Ha : 0° #05 


La estadística natural para probar estas hipótesis debe estar basada en la varianza muestral $”. De hecho, según 
se estudió en el capítulo 7, la variable aleatoria: 


(n—=1)? , 


a? ~ Xín-1) 


por lo que una estadística que nos permite fijar el nivel de significancia deseado es: 
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puesto que si Ho es cierta, Xx ps Ki . Las reglas de decisión para c) son, respectivamente: 
a) Rechazar Ho si yg > x¿(n—1) 
b) Rechazar Ho si xo < Xi-¿(n—1) 
c) Rechazar Ho siy? < Xq (=D) o si 12 xj (m-1) 


El uso de la notación: 
2 2 
Xi-a Y X1-a/2 


. . . . . . ., 2 . de ía é a . 
amerita un comentario especial. Como ya se vio antes, la distribución de y? no es simétrica, ni tiene media 
cero. Esto ocasiona, por una parte, que tengan que buscarse directamente puntos de la distribución en la cola 
izquierda, y por otra parte tiene consecuencias sobre los intervalos de confianza que se estudiarán en el capítulo 


. . 2 2 ., , 
9. Los valores en la cola izquierda Xi_« YXi-a/2 son, de acuerdo con nuestra notación, abscisas tales que el 
área a la derecha de esos puntos es 10 y 1/2, respectivamente. Por supuesto, las áreas a la izquierda son 
respectivamente & y %/2. 


Ejemplo 8.4. Para establecer la variabilidad en las mediciones de un equipo con el que se trata de determinar 
el porcentaje de magnesio en un producto, se realizan 12 determinaciones en una solución que se sabe tiene 
5% de magnesio. De acuerdo con las normas de calidad vigentes, la máxima desviación que podemos tolerar 
es de 0.2%. Es decir, que si el equipo es adecuado, debe tener una O < 0.04 (en porcentaje). La hipótesis que 
conviene probar es: 


Ho:0” >0.04 en oposición a Ha ¿0? <0.04 


de manera que sólo el rechazo de Ho con un bajo nivel de significancia nos llevaría a aceptar el equipo como 
adecuado. Las 12 determinaciones arrojan los siguientes resultados: 


5.1, 4.8, 5.2, 5.3, 4.7, 4,8, 4.9, 5.1, 5.2, 4.9, 4.8, 5.3 


Para estos datos el valor de S? es: 
S? =0.0463 


El lector debe observar que el valor de S? es uno de los puntos que corresponden a Ho, por lo que no parece 
razonable rechazarla. Para tener el análisis completo encontramos el valor de Xa: 


, (11)(0.0463) 
A AT 
Ko 0.04 j 
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El nivel de significancia que usaremos es & = 0.05. El valor obtenido de la Tabla D es: 


X09s(11)= 4.5748 


y la regla de decisión correspondiente, puesto que esta es una prueba de la cola izquierda, es “Rechazar Ho si 
xo < 4.5748”. Puesto que xo =12.7325, es claro que no pertenece a la región de rechazo, y la decisión es que, 
con 4 =0.05, no hay razón para rechazar Ho. En otras palabras, que dada la evidencia y con una probabilidad 
de Error Tipo I de cuando mucho 5%, el equipo no es confiable para el trabajo propuesto. El nivel observado es 


a=>P(xí,1 <12.7325) = 0.6888 


Gráficamente los resultados del experimento se presentan en la Figura 8.5. 


2 
Xan 


Xess 11) = 4.5748 


R 


Figura 8.5. Región de rechazo para la prueba Ho:0*>0.04 en oposición a 
Ha:0° <0.04(a=0.05),1=12. ® 


8.8. Pruebas de hipótesis sobre la media de una población 
usando aproximación Normal 


Aparte de la importancia que la distribución normal tiene como modelo en muchas situaciones, hemos 
discutido antes cómo esta importancia se incrementa por virtud del Teorema Central (fundamental) del Límite. 
Recordando lo estudiado en el capítulo 7, si se va a probar una hipótesis sobre u = E(X) en cualquier modelo 
probabilístico, y X va a usarse como estadística, el problema fundamental, que es determinar la región de 
rechazo, puede atacarse usando aproximación normal, siempre que el tamaño de la muestra sea suficientemente 


grande. En efecto, de acuerdo con el teorema: 


X= N(u,0? In) 
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De manera que en una región de rechazo determinada (digamos) por la regla de decisión X =c, sujeta a 
P(X >c|u= q4, ) = q, puede determinarse c usando la aproximación al modelo Normal, puesto que entonces 
estamos en el caso de una prueba de Z discutida en la sección 8.6. El hecho de que 0? sea desconocida no tiene 
mucha importancia en este caso, puesto que se supone que » (el tamaño de la muestra) es lo suficientemente 
grande como para que pueda usarse $ en lugar de O. La estadística que debe usarse es: 


y los puntos límite de la región de rechazo se determinan de la tabla de la distribución Normal Estándar. 


= 1 
Alternativamente puede usarse la misma estadística escrita de otra forma. Puesto que X = -y X;,Z( puede 
ES n 
escribirse: 


> Y X; -nio 


z 
s Svn (8.4) 


Para ejemplificar esta aproximación usaremos el modelo probabilístico Poisson. Otro ejemplo de mayor 
importancia se presentará en la sección 8.9, cuando se discutan las pruebas de hipótesis sobre el parámetro p de 
una distribución Binomial. 


Ejemplo 8.5. Un fenómeno que tradicionalmente ha sido representado por un modelo Poisson es el número 
de errores de imprenta por página en un libro. Supóngase que queremos probar la hipótesis (sostenida por una 
editorial) de que el número promedio de errores por página en uno de sus libros es menor de 0.2 (es decir que 
en promedio hay un error o menos por cada 5 páginas). La hipótesis que se quiere probar es: 


Ho: 20.2 en oposición a Ha: À < 0.02 


La variable aleatoria X ~ P(A) tiene como función de probabilidades: 


4 qx 
fi œ) =; x=0,1,2,... 
Xx 


y, para esa variable aleatoria: 


E(X)=4 


por lo que la hipótesis sobre Å es una hipótesis sobre la media de la distribución. Para probarla se toma una 
muestra de 100 páginas y se registra el número de errores por página. La muestra está integrada por X, X»... 
Xiop donde X; es el número de errores en la página ¡-ésima. Los resultados de la muestra son, resumiéndolos: 
90 páginas con cero errores, 7 con uno, 2 con dos y 1 con tres. Esos resultados se presentan en seguida en una 
tabla de frecuencias 
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Núm. de errores 


(x) fi fixi Lx 
0 90 0 0 
1 7 7 7 
2 2 4 8 
3 1 3 9 
E 100 14 24 


La media y varianza muestrales son: 


e D fit: E 


X= Y Ti 
A y (14? 
e 2 (Z fix) In _ 24147 1100 _,,, 


n=l 99 
La estadística Z) con esta muestra toma el valor: 


_ /100(0.14—0.20) io 
40.22 f 


Zo 


Si deseamos probar Ho con un nivel de significancia de æ = 0.03, la prueba de cola izquierda tiene como 
regla de decisión: Rechazar Ho si Zo <—Zp03. De la Tabla C obtenemos zp 13 =1.88, por lo que Ho 


se rechaza si Zo <—1.88. Es decir, que R = (2, | zọ <—1.88). Puesto que Z, E R, decidimos que con 


a=0.03 no se rechaza Ho o, más explícitamente, que dada la evidencia de la muestra, no hay razón 
para creer que el número promedio de errores por página sea menor de 0.2, con el nivel de significancia 
especificado. 


La prueba que acabamos de efectuar usando la aproximación normal puede realizarse usando la distribución 
real (en este caso la de Poisson). Aunque en general usaremos la aproximación normal, por no conocer la 
forma de la distribución o no disponer de tablas, usaremos este ejemplo para que el lector se forme una idea 
de la bondad de la aproximación. 


La prueba exacta está basada en el hecho de que X;, X»... Xy son variables aleatorias independientes Poisson 


(4). 
Un resultado similar al presentado en la distribución y? nos asegura que si X,,..., X, son variables independientes 


P (å), entonces SE ; ~ P(nA). Es decir, que la suma de las observaciones en nuestro ejemplo tendría una 
¡=1 l 

distribución P (20) bajo Ho. En la Tabla 8.5 se presentan probabilidades acumuladas en la cola izquierda de 

dicha distribución. 
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Tabla 8.5. Probabilidades acumuladas en la cola izquierda de la distribución P (20). 
fe 1 2121213141 sJ eJ zJ] E&E] s| 


iua <c) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0021 0.0050 


al L 


La regla de decisión es de la forma: Rechazar Ho si Y X, <c, donde c se elige de manera que 


P(S X,<c|A= ly) < 0.03. En la Tabla 8.5 vemos que c =11, y la región de rechazo es: 


R=ÍN x, Nx; <11) 


Puesto que en la muestra la suma de errores es 14, es claro que S x, ER, y la conclusión es la misma que 
cuando se usa la prueba aproximada. El nivel observado de significancia con la prueba exacta es 


=P() x, <14|2=2,)=0.1048 


Con la prueba aproximada se tiene 


P(Z <-—1.279)=0.1003 


de donde observamos que se tiene una aproximación bastante buena. 4 


8.9. Pruebas de hipótesis sobre p en una distribución Binomial 


En la sección 8.2 se presentaron pruebas de hipótesis sobre la distribución Binomial, usándolas para introducir 
los conceptos básicos de una prueba de hipótesis. En esta sección se resume lo discutido allí, y se presenta un 
ejemplo en que se hace una prueba de hipótesis sobre p utilizando la aproximación normal, técnica que fue 
introducida en la sección 8.8. 


Una distribución Binomial, según se ha señalado antes, se origina cuando se tiene repeticiones independientes 
de un experimento Bernoulli con probabilidad de éxito p. La información en las variables aleatorias Bernoulli 
X X),..., X, se resume en la variable aleatoria X= X, + X, +--+ X, que tiene una distribución Binomial con 
parámetros » y p. Usando la variable aleatoria X hay tres juegos de hipótesis que es interesante probar. Si py es 
un número cualquiera entre cero y uno, los juegos de hipótesis son: 

a) Ho: p< py en oposición a Ha: p> py 

b) Ho: p2 py en oposición a Ha: p< p 


c) Ho: p= py en oposición a Ha: p Æ p) 
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En los tres casos la estadística de prueba es X, o sea el número de éxitos en las 2 repeticiones del experimento 
Bernoulli. Para un nivel de significancia, las reglas de decisión correspondientes a a), b) y c) son, respectivamente: 


a) Rechazar Ho si X >c, donde ces tal que P(X>c|p=p,)<a 
b) Rechazar Ho si X <c , donde ces tal que P(X <c|p=p,)<a 


c) Rechazar Ho si X >c, oX <c),, donde c, y c son tales que 


P(Xz2a4|p=p)+P(X<c,|p=p))<a 


En general, debe tratarse que: 
PXz2a41p=p)=PX<c,|p= po) 


El lector debe recordar que, puesto que la Binomial es una distribución discreta, no siempre se encuentran 
valores c, c, o c, que den exactamente el nivel de significancia æ preestablecido. De allí que se use la desigualdad 
en todas las probabilidades. 


De los juegos de hipótesis a) y c) se presentó un ejemplo para cada uno en la sección 8.2. En cuanto al juego 
b), la técnica sería igual que en el juego a), excepto que habría que determinar c usando áreas acumuladas en la 
cola izquierda de la distribución. Puesto que estas probabilidades son las que se presentan en la Tabla A, no se 
insiste más sobre el particular. 


El otro punto que se quiere discutir en detalle en esta sección es el uso de una prueba aproximada de Z cuando el 


tamaño de muestra es grande, ya que entonces no se dispone de tablas de la distribución Binomial (¡imaginemos el 
tamaño de una tabla para n = 1000!): de acuerdo con la expresión (8.4), la segunda forma de la estadística Z, es: 


= YX, — nuo 
SÁn 


Lo 
En el presente caso Jl = X, la variable aleatoria Binomial. La media y la varianza de cada X, son p y 
p(1— p). La estadística Z es entonces: 


X — npo 


V”p (1- po) 


y las reglas de decisión para a), b) y c) son: 
a) Rechazar Ho si Zo > Za 
b) Rechazar Hosi Zy <-—2, 


c) Rechazar Ho si Zj > zan OS Zo S- Zan 
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A continuación se presenta un ejemplo de una prueba de dos colas en la distribución Binomial, usando la prueba 
aproximada. 


Ejemplo 8.6. De acuerdo con el censo de 1970, la proporción de individuos menores de 40 años en cierta ciudad 
es de 70%. Para determinar si esa proporción se ha modificado en 1978 se toma una muestra de 800 personas, 
y se encuentra que de las 800 personas entrevistadas, 600 tienen más de 40 años. ¿Es la información en esta 
muestra suficiente para llegar a la conclusión que con Y = 0.01 la proporción de habitantes mayores de 40 años 
se modificado? 


La hipótesis que se desea probar es: 
Ho: p=0.7 en oposición a Ha: p # 0.7 
En esta muestra X =600 y n=800. Dada la hipótesis (p = 0.7), el valor de la estadística de prueba es: 


600—(800)(0.7) _ 40 
800(0.7)(0.3) 12.96 


Con «a=0.01, la tabla C proporciona el valor Zoos = 2.575. La región de rechazo es 
R = {zo | zo <-2.575 o z, > 2.575}. El valor de Z, en la muestra es Z} = 3.09, por lo que Zo E R. La 
conclusión es que con & = 0.01 se rechaza Ho y se concluye que la proporción de individuos menores 40 años se 
ha modificado. De hecho, el valor observado (600) es mucho mayor que el valor esperado bajo Ho (np) = 560), 
por lo que, con las reservas que se han indicado en la prueba de una hipótesis estadística, la conclusión es que la 
proporción de individuos mayores de 40 años ha aumentado significativamente (con un nivel de significancia de 
1%). El cálculo del nivel observado de significancia en una prueba de dos colas presenta una característica especial 
y usaremos este ejemplo para destacarla. Dado que el valor esperado de X bajo Ho es 560, y que se quiere probar 
que ese valor esperado no se ha modificado en una u otra dirección, el valor observado de significancia de la 
muestra debe considerar las desviaciones por exceso, pero también las desviaciones por defecto. Concretamente, 
y en nuestro ejemplo: 


a=P(X=>600| p=0.7)+P(X<520| p=0.7) 


ya que 600 (el valor observado) y 520 son los valores equidistantes del valor esperado (560). Usando la 


aproximación normal: 


/800(0.7)(0.3) 


560 
pix =600)= p| z = 200-380 1_ Piz =3.09) 
800(0.71(0.3) 
2 ae 
P(x s5%0)=P|z< O ) 025-309) 


Entonces: 


a=P(2>3.09)+P(Z <-3.09)=2P(Z <-3.09) = 2(0.001) = 0.002 
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Es decir, que con cualquier æ > 0.002 se rechaza Ho, por lo que con 4 = 0.01 se rechaza Ho. El lector debe 
verificar que la corrección por continuidad es innecesaria con este tamaño de muestra. 6 


8.10. Error Tipo l, Error Tipo ll y tamaño de muestra 


En varias secciones, pero sobre todo en la 8.2, se han presentado ejemplos donde se sugieren las interrelaciones 
entre los errores de ambos tipos y el tamaño de muestra. Una discusión exhaustiva de estas relaciones excede, 
con mucho, los límites de espacio y profundidad que se han predeterminado para este texto. A pesar de esta 
limitación se ha considerado conveniente explorar dichas relaciones en una prueba de Z. La importancia de esta 
prueba está garantizada por la versatilidad de la distribución Normal y por el Teorema Central del Límite, el cual 
permite la aplicación de una prueba de Z siempre que se tenga un número grande de variables independientes 
en la muestra. Si se tiene una muestra aleatoria X}, X»... Xp en la cual £(X,)=u y Var(X,)=0?, para 
i =1,2,...,7, la estadística de prueba: 


es la adecuada para cualquiera de los tres juegos de hipótesis: 
a) Ho: u S uy en oposición a Ha: u > Uy 
b) Ho: u > Uyen oposición a Ha: u < Uo 


c) Ho: u = uy en oposición a Ha: U HU, 


En el primer caso la regla de decisión es: Rechazar Ho si Z} > z,,. Consideremos un nivel arbitrario œ de 
significancia y examinemos la probabilidad de Error Tipo II para diferentes alternativas. Para cualquier valor de 
4 en la hipótesis alternativa, la distribución de Z% se encuentra desplazada a la derecha. La situación se ilustra 
gráficamente en la Figura 8.6. De ella es claro que mientras menor sea (%, mayor será el valor de z, y, por 
consiguiente, el valor de la probabilidad de Error Tipo II será mayor. Por el contrario, si se aumenta q, el valor 
de 2, disminuye y, en consecuencia, 8 disminuye. Esto nos ilustra un hecho que se ha discutido previamente 
y que consiste en que disminuir la probabilidad de Error Tipo I aumenta la probabilidad de Error Tipo II, y 
viceversa. También es claro que una vez fijado el nivel de significancia, la probabilidad de Error Tipo II depende 
del valor de u en el espacio de la hipótesis alternativa. Mientras más alejado esté el valor de u de 4, menor será 
el valor de J, mientras que éste aumenta si 4 está muy cerca de 4o. Esto debe interpretarse como sigue: una 
prueba de hipótesis que pretende distinguir entre dos valores posibles muy cercanos, decide erróneamente una 
proporción mayor de veces que una que pretende distinguir entre dos valores muy alejados, de acuerdo con 
nuestra interpretación de la probabilidad como frecuencia relativa. 


Estas mismas observaciones pueden hacerse para una prueba de la cola izquierda. La situación se ilustra en la 
Figura 8.7. 


En cuanto a una prueba de dos colas, la situación es más difícil de ilustrar gráficamente, por lo que únicamente 
anotamos que lo que se dijo antes sobre la relación entre los errores es igualmente válido en ese caso. 
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Figura 8.6. Error Tipo I y Error Tipo II en una prueba de Z de la cola derecha. 


Figura 8.7. Error Tipo 1 y Error Tipo II en una prueba de Z de cola izquierda. 


La influencia que tiene el tamaño de muestra la analizaremos sobre el Error Tipo II, de acuerdo con la estrategia 
adoptada, que consiste en fijar œ de antemano. Para presentar la discusión es conveniente pensar en la prueba 
realizada con la estadística X . Como se recordará, para una prueba de la cola derecha la regla de decisión basada 
en X es: 


Es O 
Rechazar Ho si X > Uy +2 

Ho J'n” 
La región de rechazo y los Errores Tipo I y II se presentan en la Figura 8.8. Puesto que la distribución de X 


2 - . . . . . Y 
es N ( 1,07! n), aumentar el tamaño de muestra tiene el efecto de disminuir la varianza de X. El efecto de 
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esta reducción se manifiesta en la Figura 8.8 de dos maneras. La primera es que los valores de X estarán más 
concentrados alrededor del valor de 4, es decir, que las curvas en la Figura 8.8 estarán menos dispersas alrededor 
del valor medio. La segunda es que el valor límite de la región de rechazo disminuye, ya que, claramente, si el 
nuevo tamaño de muestra 2* es mayor que », entonces 


O O 
uo e < nu) pi 


El lector debe notar que esto es necesario para que el nivel de significancia & se mantenga, en vista de que 
las curvas serán más “esbeltas”. El efecto combinado de estos dos hechos es disminuir el valor de $. La 
conclusión es que el valor de P(u) disminuye para cualquier valor de u (dada una a arbitraria) si se aumenta el 
tamaño de la muestra. El corolario es que aumenta Ò(u) en Ha, es decir, la capacidad de la prueba de rechazar 
hipótesis falsas. 


Figuras 8.8. Efecto de » sobre el error Tipo Il. 


En el ejemplo 8.7 se ilustran los puntos discutidos en esta sección. Por razones de espacio no se analiza el efecto 
del tamaño de muestra en los otros tipos de hipótesis, pero el lector puede verificar que, salvo las particularidades 
de cada caso, el efecto es similar. 


Ejemplo 8.7. Supóngase que se desea probar el juego de hipótesis: 
Ho: u S Uy en oposición a Ha: u > Uy 


en una situación donde “se conoce” el valor de O, y se está dispuesto a suponer que las condiciones necesarias 
para una prueba de Z están justificadas. En otras palabras, se supone que la muestra X,..., X,, es una muestra 


aleatoria de M ( R ). La regla de decisión para la prueba es: Rechazar Ho si X > ug + (9 1/2) Zg. La función 
de poder para la prueba es, entonces: 
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ó(u)=P [Rechazar Ho| u]= PX + la] 
=P[X—uz un -u+lo/Vn)z, ] 
=P[Z > z, +HV2/0) (us -u)] 


Esta última expresión es muy interesante, puesto que nos ilustra sobre el nivel de significancia y la probabilidad 
de Error Tipo II. En particular podemos notar lo siguiente: 


a) 


b) 


c) 


Para todo valor de 4 en Ho(u < ug ) se tiene que y — 1 > 0, por lo que Zg +4n/0(u, = U) È Zg» 
esto quiere decir que para todo valor de u en Ho :P[Z A +42 10 (1, -u)] <P[Z>2,]=a. Es 


decir, que el nivel de significancia (mayor valor de la probabilidad de Error Tipo I) es æ. 


Para todo valor de 4 en Ha(u > ug) se tiene que Ho — u <0, por lo que Zg +4n lo(u =U) < Zg» 
esto quiere decir que para todo valor de u en Ha: P|z Sga F Vnlo(u = u)] >P[Z>z,]=a, lo 


que implica que la probabilidad de rechazar hipótesis falsas es mayor que æ. Pero además implica que 
mientras mayor sea 4, mayor será Ò( u), es decir, que Ó((4) es una función creciente de u. 


También es evidente que mientras mayor sea Œ, puesto que Z„ es menor, Ô( u) aumenta y por tanto el 
Error Tipo II disminuye. 


Finalmente, para æ fija y un valor de 4 en Ha(u> Uo), aumentar n tiene el efecto de disminuir 
Za +4n/0(u, — 14) y, por tanto, de aumentar Ô( u) en Ha, reduciendo así la probabilidad de Error 
Tipo II. 


Todas estas observaciones son meramente otra forma de presentar las ideas discutidas previamente en esta 
sección. A continuación se da una ilustración numérica de estas ideas. 


Supóngase que Ho =5 y g? =4. Para estudiar la relación entre las probabilidades de Error Tipo 1 y Tipo 
II consideramos 3 niveles de significancia: 4=0.01, æ =0.05 y æ =0.10. El tamaño de muestra se fija en 
n=10. 


puesto que Zoo; =2.33, Zoos =1.645 y Zo. 10 =1.28, las funciones de poder de las pruebas para los diferentes 
niveles de significancia son, de acuerdo con (8.5): 


90.01 (1) =P[Z >2.33+1.58(5- u)] 
8005 (u) =P [Z >1.645+1.58(5— u)] 
80.10 (1) =P[Z >1.28+1.58(5- u)] 


Evaluaciones de estas funciones de poder para un amplio espectro de valores de se presentan en la Tabla 8.6. 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla 8.6. Funciones de poder para diferentes niveles de significancia en 


una prueba de Z. 
90.01 (4) 90.05 (4) 90.10 (4) 
4.4 0.0005 
Valores de u en Ho 47 0.0026 


5.0 0.0100 
5.3 0.0314 
5.6 0.0838 
5.9 0.1814 


6.2 0.3336 
6.5 0.5160 
6.8 0.6950 
7.1 0.8389 
7.4 0.9279 
ToT 0.9738 
8.0 0.9920 


Valores de 4 en Ha 


En la Figura 8.9 se grafican las funciones de poder de las pruebas con diferentes niveles de significancia, y son 
evidentes las consideraciones que se han hecho antes. El lector puede comparar esta figura con la 8.1, donde se 
presenta una comparación semejante para una prueba binomial, y verificar que las relaciones entre los errores I 
y II son del mismo tipo en ambos casos. 6 


ò(u) 


4.5 5.0 K 6.0 6.5 7.0 És 8.0 


Figura 8.9. Curvas de poder para tres pruebas de Z con diferentes niveles de significancia. 


Para finalizar este capítulo se ilustrará el efecto del tamaño de muestra sobre el Error Tipo II. Con este fin 
examinamos la función de poder de la prueba con æ = 0.01, si se toma una muestra de tamaño 50. La función 
de poder es ahora: 
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9(u)= P[Rechazar Ho | u] = P[z > za +vVn l0 (u -u)] 
=P[Z >2.33+3.54(5— u)] 


Los valores para diferentes u se dan en la Tabla 8.7. 


Tabla 8.7. Valores (u) para una prueba de Z de Ho: u<5 en oposición a Ha: 1 >5.0. 4=0.01,n=50,0? =4 


4.4 4.7 5.0 5.3 5.6 5.9 6.2 6.5 6.8 


0.0000 0.0003 0.0100 0.1020 0.4168 0.8051 0.9726 0.9986 0.9999 


Esta función de poder, junto con la de la prueba con el mismo nivel de significancia para n =10, se grafican 
en la Figura 8.10. Es claro de la figura, o de la comparación de la Tabla 8.7 con la primera columna de la 
Tabla 8.6, que el poder de la prueba se ha incrementado uniformemente para todos los valores de u en Ha y, 
consecuentemente, el Error Tipo II ha disminuido su probabilidad uniformemente. La moraleja del ejemplo es 
que, dado un nivel de significancia æ, la forma de tener una mejor prueba, por lo que toca a la probabilidad de 
Error Tipo II, es aumentar el tamaño de la muestra. 


ó(u) — n=50,4=0.01 


, ---- n=10,4=0.01 


Figura 8.10. Comparación de dos curvas de poder con el mismo nivel de significancia y 


diferente tamaño de muestra. 
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Ejercicios 


8.1. Un investigador desea probar la hipótesis consistente en que menos del 30% de los habitantes de una 
gran ciudad apoyan a cierto partido político. Suponiendo que el tamaño de la población es suficiente 
para que pueda emplearse un modelo Binomial desea probar: 


Ho: p 20.3 en oposición a Ha: p<0.3 
Para esta hipótesis (de la cola izquierda), la regla de decisión es: Rechazar Ho si X < c, donde ces una 
constante que depende del nivel de significancia deseado y X es el número de individuos (éxitos) que 
apoya al partido en cuestión, de un total de » entrevistados. Para n=12: 
a) Si se elige c = 1, ¿cuál es el nivel de significancia de la prueba resultante? ¿Cuál es la probabilidad 
de Error Tipo I para p = 0.4? ¿Para p = 0.6? Calcule las probabilidades de Error Tipo II para p = 
0.2, p = 0.1 yp = 0.5. 


b) Suponga ahora que c = 2. Conteste las mismas preguntas que en el inciso a). 


8.2. En el problema 8.1 suponga ahora que el tamaño de muestra (7) es 25. 
a) ¿Cuál es el nivel de significancia para c = 1? ¿Para c = 2? 
b) Con este tamaño de muestra existe una prueba con nivel de significancia de 0.0904, o sea 
prácticamente el de la prueba en el inciso a) del ejercicio 8.1. Encuentre la regla de decisión para 
dicha prueba y calcule (0.4), (0.6), $(0.2), B(0.1) y B(0.05). 
8.3. Con los resultados de los ejercicios 8.1 y 8.2 realice las siguientes comparaciones: 
a) En 8.1 a y 8.1 b la diferencia está en la regla de decisión. Al aumentar el número de puntos de la 
región de rechazo necesariamente se incrementa el nivel de significancia de la prueba. ¿Cómo se 
refleja ésto en (0.4) y (0.6)? ¿Qué efecto tiene sobre (0.2), B(0.1) y B(0.05)? ¿Qué principio 


general ilustran estos resultados? 


b) En 8.2 se usan las mismas regiones críticas que en 8.1, pero con mayor tamaño de muestra. ¿Qué 
ocurre con los niveles de significancia? 


c) En 8.2 b se obtuvo una prueba con (aproximadamente) el mismo nivel de significancia que en 8.1 
a, pero con mayor tamaño de muestra. ¿Cómo se refleja el cambio en las probabilidades de Error 


Tipo I y Tipo I? 


8.4. Grafique las funciones de poder de las pruebas en 8.1 a y 8.2 b y compárelas. 


nn 


8.5. 


8.6. 


8.7. 


8.8. 
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Suponga que se tiene un lote de 30 artículos que se van a inspeccionar para determinar, en cada 
caso, si el artículo cumple con las normas de calidad establecidas o si es defectuoso. En el proceso 
de determinar si un artículo es aceptable (4) o defectuoso (D) se le destruye, por lo que el muestreo 
forzosamente es sin reemplazo. Los artículos han sido producidos con una maquinaria que se ha 
decidido desechar si produce más de 10% de defectuosos. 


a) Plantee el juego de hipótesis pertinente, ya sea en términos del número de defectuosos (D) o de la 
proporción D/30. 


b) Encuentre la regla de decisión para una prueba con œ = 0.0394, con un tamaño de muestra n = 4, 
c) Encuentre la regla de decisión para una prueba con 4=0.001, con n = 4. 
d) Calcule las probabilidades de Error Tipo II para: 


D = 4 (p = 0.133), D = 6 (p = 0.02), D = 8 (p = 0.267), D = 10 (p = 0.333), 
D = 14 (p = 0.467), D = 18 (p = 0.6), y D = 20 (p = 0.667), 


tanto para la prueba del inciso 6) como para la del inciso c). 
e) En problemas de control de calidad como éste se acostumbra trabajar con la “función característica 


de operación”, que se define como 1— función de poder. Grafique las funciones características de 
las pruebas en $) y c) y compárelas. 


Refiriéndonos al ejercicio 8.5 suponga ahora que se toma una muestra de tamaño » = 11. Existe una 
prueba con a = 0.0406, o sea (muy aproximadamente) con el nivel de significancia de la prueba en 


8.5 b. 
a) Encuentre la regla de decisión para la prueba en cuestión. 
b) Calcule las probabilidades de Error Tipo II con esta prueba para los valores de D en el ejercicio 8.5 


d. Compárelos con los de la prueba con 7 = 4 y æ similar. 


En el ejercicio 8.6 suponga que al tomar la muestra se encuentra dos defectuosos (X = 2). ¿Cuál es el 
nivel observado de significancia de la muestra? 


En un invernadero se tienen plántulas que van a trasplantarse posteriormente y que están siendo 
atacadas por una enfermedad. Se ha decidido aplicar un tratamiento si más de 25% de las plántulas 
están afectadas. Suponga que el número de plántulas es lo suficientemente grande como para que 
pueda usarse un modelo Binomial y que el tamaño de muestra es 16. 


a) Establezca el juego de hipótesis pertinente al problema. 


b) Encuentre una regla de decisión que define una prueba con nivel de significancia 4 = 0.0795. 


En 
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8:9. 


8.10. 


8:11 


. 


8.12. 


8.13. 


c) Suponga que, de las 16 plantas examinadas, nueve se encuentran atacadas por la enfermedad. Con 
a = 0.0795, ¿decidiríamos aplicar el tratamiento? 


d) ¿Cuál es el nivel observado de significancia si se encuentran nueve plantas atacadas? ¿Si se encuentran 
inco? 
cinco? 


Al realizar cruzas entre animales de una especie se espera, de acuerdo con una teoría genética, que se 
obtenga un 80% de crías con cierta característica. Suponga que se obtienen 16 crías, y use el modelo 
Binomial. X es el número de crías que muestran la característica en cuestión. 


a) Formule el juego de hipótesis pertinente. 


b) Si se elige la regla de decisión consistente en rechazar Ho si X > 16 o X < 9, ¿cuál es el nivel de 
significancia de la prueba? 


c) Calcule el poder de la prueba (9(p)) para p = 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 y 0.95. 


En el ejercicio 8.9 suponga que se obtienen 40 crías. Verifique que si la regla de decisión consiste 
en rechazar Ho si X < 26 o X > 37, el nivel de significancia de la prueba es 0.0478 (muy similar 
al de la prueba en el ejercicio 8.9). Para realizar la comprobación pedida use el hecho de que si 
X ~ Binl40,0.8), fx (x)=0 (con una aproximación a 4 decimales) para x = 0, 1, 2,..., 20. Evalúe 
la función de poder (9(p)) para p = 0.5, 0.6, 0.7, 0.9 y 0.95. 


Grafique (en el mismo sistema de ejes coordenados) las funciones de poder de las pruebas en los 
ejercicios 8.9 y 8.10 y compárelas. 


De 20 estudiantes inscritos en un curso, siete han manifestado, al llenar su solicitud de admisión, que 
pertenecen a un cierto estrato económico. El profesor del curso decide elegir 6 estudiantes al azar y 
realizar una investigación (en cada caso) para determinar si han declarado la verdad. 


a) ¿Cuál es la distribución de X = número de estudiantes que pertenecen a dicho estrato? ¿Cuál es la 
distribución si todos han declarado la verdad? 


b) Calcule las probabilidades para los posibles valores de X, suponiendo que todos han declarado la 
verdad. El profesor quiere probar la hipótesis de que sus estudiantes no han mentido. Establezca el 
juego de hipótesis pertinente, en función del parámetro de la distribución de X. 


c) ¿Qué nivel de significancia tiene la prueba con regla de decisión: rechazar Ho si X < 0 o X > 4? 
En una planta industrial se ha registrado el promedio semanal de accidentes graves de trabajo 


durante los últimos 20 años. Este promedio resulta ser 0.05. Por necesidades de producción se 
han modificado las condiciones de trabajo y se teme que esto cause un incremento en el número 


8.14. 


8.15. 


8.16. 
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promedio de accidentes. Sea X el número de accidentes por semana bajo las nuevas condiciones. 


Suponga que X ~ Pa). 
a) Plantee el juego de hipótesis en función de À, el parámetro de la distribución de Poisson. 


b) Suponga que se registra el número de accidentes durante 14 semanas. Encuentre una regla de 
decisión que garantice un nivel de significancia a = 0.1558. 


c) Suponga que de las 14 semanas observadas, en 13 no se registraron accidentes y en una hubo un 
accidente. ¿Cuál es el nivel observado de significancia de la muestra? ¿Se rechaza Ho con & = 
0.1558? 


d) Conteste la misma pregunta del inciso c) si en 11 semanas no se registraron accidentes, en dos se 
registró un accidente en cada una, y en una semana ocurrieron dos accidentes. 


Refiriéndonos al ejercicio 8.13: 
a) Encuentre una regla de decisión que proporcione una prueba con æ = 0.0.0341. 


b) Con esta prueba es claro que las probabilidades de Error Tipo I [$(2)] aumentarán para los 
valores de À en el dominio de la hipótesis alternativa, con respecto a la prueba con & = 0.1558 en 
el ejercicio 8.13. Verifíquelo paraÁ = 0.07 yA =0.1. 


Con respecto a los ejercicios 8.14 y 8.13, si se rechaza la hipótesis nula, es decir, si se concluye que bajo 
las nuevas condiciones ha aumentado el promedio de accidentes de trabajo, se tomarán medidas extra 
de seguridad. En caso contrario no se tomarán medidas. 


a) Interprete las consecuencias de un error del primer tipo y de uno del segundo tipo en función de 
las medidas a tomar. 


b) De acuerdo con su interpretación en el inciso a), ¿para cuál tipo de error debería minimizarse la 
probabilidad? ¿Cuál de las dos pruebas elegiría usted: la del ejercicio 8.13 (a = 0.1558) o la del 
ejercicio 8.14 (a = 0.0341)? 


Suponga que en un parque nacional se determinó 10 años atrás que el número promedio de animales 
(por kilómetro cuadrado) de una especie es 0.5. Para decidir si esta densidad se ha modificado se 
inspeccionan 12 kilómetros cuadrados. Suponga que el número de individuos por unidad de área sigue 
una distribución de Poisson. 


a) Establezca el juego de hipótesis correspondiente. 
b) Sea Y el número total de animales de la especie en los 12 kilómetros cuadrados inspeccionados. 


Encuentre números c, y c, tales que P(Y > c,)=0.020 y P(Y <c,)=0.0174, suponiendo que 
la densidad de individuos por kilómetro cuadrado no se ha modificado. 
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a 


c) Del inciso b) es claro que el nivel de significancia de la prueba con regla de decisión: Rechazar Ho si 
Y > c, o Y < c, es 0.0374. Evalúe la función de poder de esta prueba para À = 0.025, 0.075, 0.15, 
0.20, 0.30, 0.40, 0.60, 0.80, 1.0, 1.25 y 1.50. 


d) Grafique la función de poder de la prueba. 


- En un estudio del valor alimenticio de la vegetación lacustre como forraje se determinó el porcentaje 


de proteína en 28 muestras de vegetación. Los valores obtenidos son: 


12.72, 13.62, 17.65, 17.53, 17.34, 13.68, 10.41, 12.26, 19.03, 14.44, 14.11, 
13.38, 11.49, 12.13, 19.25, 15.74, 14.81, 15.03, 13.29, 17.03, 5.21, 18.92 
13.01, 13.94, 14.75, 13.90, 13.72, 14.60. 


(FUENTE: Science. Vol. 80, Núm. 208, pág. 532. Dic. 7, 1934). 


a) De estudios previos se sabe que el porcentaje de proteína en el pasto sudán es 9.26. Pruebe la 
hipótesis de que la vegetación lacustre tiene más proteína que el pasto sudán. Use un nivel de 
significancia 4 = 0.01. Suponga distribución normal. 


b) Para este inciso proceda como si el valor de O fuese conocido [tome como ø el valor de S calculado 
en el inciso 4)] y use la distribución de Z en vez de +. ¿Cuál es la regla de decisión ahora? Evalúe la 
función de poder [5(u)] para 4 = 9.26, 10, 10.25, 10.50, 10.75, 11, 11.5 y 12. Para simplificar 
sus cálculos verifique que: 


d(u)=P[Z, 2 za ES g 


ET] (*) 


c) Grafique la función de poder de la prueba. Note que es una función creciente de U, como es 
evidente de la expresión (*). La expresión nos dice que para un valor de u en el espacio de Ha, la 
probabilidad de tomar una decisión correcta (rechazar Ho) depende de la distancia entre My ly. O 
sea que los errores costosos (los que ocurren cuando 4 es mucho mayor que 4o) son poco probables 
[802)= 0.0044], mientras que los errores muy probables [800) = 0.8389] son poco costosos. 


. Refiriéndonos al ejercicio 8.17, note que el lado derecho de la desigualdad en (*) depende del nivel de 


significancia æ, del tamaño de nuestra », de la desviación estándar O y de la distancia 4, — u. El efecto 
de la distancia ya fue estudiado en 8.17 c. 


a) Note que a mayor &, menor Zg, por lo que el poder de la prueba se incrementa. Verifique esto 
tomando & = 0.10 en 8.17 b. Interprete sus resultados. 


b) ¿Qué ocurriría si la desviación estándar de la población fuera mayor? ¿Si fuera menor? Corrobore 
su respuesta en el primer caso tomando O = 5. Mantenga & = 0.01. 


8.19. 


8.20. 


8.21. 


8.22. 


8.23. 
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c) Con respecto al tamaño de muestra, ¿qué debe ocurrir si se aumenta? Verifique su respuesta 
tomando 2 = 49. Mantenga las demás condiciones igual que en 8.17 6. 


Con respecto a los ejercicios 8.17 y 8.18 note que variar œ sólo modifica $ (para bien) a costa de 
aumentar (%. Por otra parte, O es una constante poblacional que no depende del investigador. De aquí 
que la única forma que tenemos de mejorar la potencia sea aumentar el tamaño de muestra. Con & = 
0.01 y n = 28 la probabilidad de rechazar Ho (concluir que la vegetación lacustre tiene más proteína 
que el pasto sudán) cuando ų = 10.75 (es decir, cuando la vegetación lacustre tiene un 1.49% más de 
proteína que el pasto sudán) es de 0.6406. Suponga que se quiere que esta probabilidad sea de 0.985. 
¿De qué tamaño debe tomarse la muestra? En la práctica O no se conoce, por lo que el tamaño exacto 
de muestra no puede calcularse. Sin embargo, si se tiene una estimación previa de O”, ésta puede usarse 
para los cálculos. 


En las etiquetas de una marca de leche evaporada se afirma que esta contiene “no menos de 850 U. 
I. (unidades internacionales) de vitamina D por litro”. Se realizan 15 determinaciones del contenido 
(por litro) de vitamina D y se obtienen los siguientes resultados: 


836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861. 


Pruebe la hipótesis del fabricante con æ = 0.025. ¿Cuál es el nivel observado de significancia de la 
muestra? 


Suponga que se sabe que el cociente de inteligencia (Stanford-Binet) de la población formada por 
niños entre 9 y 13 años tiene una media de 45. Un investigador quiere probar la hipótesis de que la 
media de un subgrupo de esa población es mayor, para lo cual toma una muestra de tamaño 30 de ese 
subgrupo y encuentra las estadísticas X = 49.05 y Sy =14.80. Pruebe la hipótesis del investigador 
con & = 0.05. ¿Cuál es el nivel observado de significancia de la muestra? ¿Cuál sería la conclusión con 
a = 0.10? Suponga distribución Normal. 


En un experimento (Science, vol. 87. Núm. 2251, feb. 8, 1938) se determinó el porcentaje de agua en 
9 medusas (Aurelia sp.). Los resultados se presentan en seguida: 

95.9, 96.0, 96.6, 96.0, 96.2, 96.2, 96.3, 96.2, 96.1 

El objetivo del experimento era probar la hipótesis, predominante entre los biólogos de la época, de 


que el contenido de agua es de 99.8%. Pruebe esa hipótesis con æ = 0.01. 


Las siguientes son determinaciones del porcentaje de calcio en 9 especímenes de lepidolita encontrados 


en Rhodesia: 


0.006, 0.007, 0.010, 0.015, 0.006, 0.012, 0.010, 0.010, 0.070. 
(FUENTE: Science, vol. 114, pág. 65. 20 de julio de 1951). 
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8.24, 


8.25. 


Con a = 0.02 pruebe que el contenido promedio de calcio es 0.02. 


En una planta que se cultiva comercialmente se sabe (de registros existentes) que el número de días a 
la floración es 80. Se ha desarrollado un compuesto químico que se supone acelera el proceso. En un 
experimento se siembran 20 lotes aplicando el compuesto. El número promedio de días a la floración 
en el experimento es 75.8, con una desviación estándar de 6.2 días. ¿Es suficiente esta evidencia para 
concluir que el compuesto reduce la media de los días a la floración? Use a = 0.005. 


Para determinar el contenido de oxígeno en aire seco se utiliza una técnica gravimétrica que se 
considera lo suficientemente precisa si tiene una desviación estándar menor de 0.006 (en porcentaje 
por volumen). En 15 determinaciones realizadas con el método en la misma muestra se obtuvieron los 
siguientes resultados (porcentaje por volumen en aire seco): 


20.9468, 20.9440, 20.9450, 20.9460, 20.9469, 20.9443, 20.9440, 20.9447, 
20.9469, 20.9438, 20.9443, 20.9448, 20.9440, 20.9462, 20.9483. 


Pruebe la hipótesis de que la desviación estándar del método es menor que 0.006. Use a = 0.01. 


. Una maquinaria para la fabricación de agujas para la reproducción de discos fonográficos debe 


producir especímenes cuya masa efectiva (en la punta) sea de 0.7 mg. Suponga que la masa promedio 
es la correcta, pero se teme que una modificación reciente en la maquinaria haya incrementado la 
varianza. El proceso de fabricación está fuera de control si ø > 0.018. En una muestra de 19 agujas se 
determina la masa de cada una, obteniéndose los siguientes resultados (en miligramos): 


0.705, 0.710, 0.692, 0.680, 0.698, 0.708, 0.712, 0.608, 0.703, 0.726, 0.702, 
0.699, 0.683, 0.714, 0.720, 0.708, 0.696, 0.701, 0.697. 


Pruebe la hipótesis de que el proceso está fuera de control. Use æ = 0.05. 


. Para un insecto que ataca al algodonero, se ha determinado que el umbral económico es 0.4. Es 


decir, que debe practicarse alguna medida de control si se tiene un promedio de más de 0.4 insectos 
por planta. Se examinan 150 plantas al azar y se encuentra 63 insectos. Suponga que la distribución 
espacial de esta especie puede modelarse por una Poisson. Use aproximación Normal. 


a) Formule el juego de hipótesis para el cual Ha indica que se ha alcanzado el umbral económico. 


b) Pruebe la hipótesis con un nivel de significancia = 0.10. ¿Cuál es el nivel observado de significancia 
de la muestra? ¿Debe adoptarse alguna medida de control? 


c) Pruebe que 0(4)= P li >2z.|4|=P z> (aaa), 
y nA A Å 


Calcule (4) paraA = 0.45, 0.47, 0.50, 0.52, 0.55 y 0.60 
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8.28. Los registros de un aeropuerto (en los últimos 10 años) indican que de cada 1000 operaciones de 
aterrizaje o despegue, 15 se dan en condiciones “menos que óptimas”. Recientemente se ha mejorado 
el equipo electrónico auxiliar, pero al mismo tiempo se ha incrementado el tráfico aéreo. Para decidir 
qué efecto ha tenido la combinación de estos factores se analizan 200 operaciones. Sea X el número de 
operaciones (en la muestra) realizadas en condiciones “menos que óptimas”. 


a) Suponga que X tiene distribución Binomial. Formule la hipótesis de que no ha habido cambio en 
la frecuencia de interés. ¿Cuál es el nivel de significancia si se toma la regla de decisión: rechazar Ho 
si X< 0 0 X > 7? (Aproxime a sólo 3 decimales). 


b) ¿Cuál sería la conclusión si X = 0? ¿Si X = 6? ¿Si X = 9? Conteste refiriéndose a la frecuencia de 
interés. 


8.29. En el ejercicio 8.28 suponga que X tiene distribución Poisson. Bajo esta suposición conteste las mismas 
preguntas. Compare los resultados y explique las similitudes o diferencias. 


8.30. Resuelva el ejercicio 8.28 usando el teorema central del límite. Use corrección por continuidad. 
Compare resultados (también con 8.29). 


8.31. En un estudio estadístico sobre científicos de los Estados Unidos de Norteamérica se encontró que de 
una muestra (suponga que aleatoria) de 1000 científicos, 126 habían nacido en otros países. 


(FUENTE: Science, vol, 24, Núm. 623, pág. 734, 1906). 


Pruebe la hipótesis de que la proporción de científicos nacidos fuera es menor de 0.14. Use a = 
0.0281. ¿Cuál es el nivel observado de significancia de la muestra? Use aproximación Normal. 


8.32. Con respecto al ejercicio 8.31 suponga que la muestra hubiése sido de 5000 científicos y que la 
proporción de nacidos en el extranjero fuera la misma. Es decir que 630 pertenecieran a esa clase. En 
estas condiciones repita el ejercicio 8.31. 


8.33. ¿Por qué son tan radicalmente distintas las conclusiones en 8.31 y 8.32 si la frecuencia relativa 
observada es la misma? Interprete en relación con la frecuencia relativa hipotética (0.14) y la observada 


(0.126). 


¿orth nothing, but is free 


E 


Estimación 


9.1. Introducción 


En el capítulo 8 se estudió la técnica de inferencia estadística consistente en probar hipótesis sobre un 
parámetro. Las otras técnicas de uso común se refieren a la estimación de parámetros. La idea es: para probar 
una hipótesis estadística dividimos el rango de valores posibles del parámetro de interés en dos subconjuntos. 
Uno de ellos define el espacio de la hipótesis nula y el otro el de la alternativa. Una vez tomada la muestra 
decicidimos que, con ciertas probabilidades de error, el parámetro en cuestión pertenece a uno de esos 
subconjuntos. Dos preguntas igualmente válidas serían: ¿qué valor podemos atribuir al parámetro con la 
limitada información que proporciona la muestra? y ¿en qué intervalo es más probable que se encuentre el 
parámetro dada la información que se tiene? Para contestar estas dos preguntas se han desarrollado las técnicas 
de inferencia que se agrupan bajo el nombre de estimación de parámetros. Para la primera pregunta se tiene 
la técnica conocida como estimación puntual (indicando que el parámetro se estima por un número) y para 
la segunda se dispone de la técnica llamada estimación por intervalo, debido a que proporciona un intervalo 
(que se llamará “de confianza”) en el que se cree que el parámetro se encuentra, con cierta probabilidad. Este 
capítulo está dedicado a la estimación puntual y por intervalo de los parámetros de un modelo probabilístico. 
El hecho de que se presente el tema de estimación después del estudio de pruebas de hipótesis, inversamente 
al orden que tradicionalmente se sigue en otros textos, no implica que los autores consideren que este tema 
tiene una importancia menor que el presentado en primer lugar; al contrario, nuestra opinión es que el tipo 
de inferencia más útil es la estimación por intervalo. El orden seguido obedece a la convicción de los autores 


de que ésta es la forma didácticamente más conveniente. 


9.2. Conceptos básicos en estimación puntual 


La situación que se discutirá se describe enseguida. Se tienen variables aleatorias X}, X»... X, las cuales se 
supone independientes, con el mismo modelo probabilístico. Es decir, se cuenta con una muestra aleatoria en 
el sentido explicado en el capítulo 7. Las características de la estimación con variables aleatorias dependientes 
no se discutirán en este texto. Sea 0 un parámetro de interés en el modelo probabilístico que se adopta para las 
variables en la muestra. El propósito de la estimación puntual es obtener una estadística (función de las observaciones) 


A 
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que, una vez evaluada en la muestra, nos proporcione un valor que plausiblemente refleje el del parámetro desconocido. 
En este contexto, a la estadística en cuestión se le llama estimador. 


Ejemplo 9.1. Si X, Xao0eo X, es una muestra aleatoria de un modelo probabilístico en el cual 
E(X,)= uVar(X,)=9" (i=1,2,....1), u y 177 son dos parámetros de interés. 


Las estadísticas: 


7 . 2 . F 2 . 
son comúnmente usadas como estimadores de 4 y 1”, respectivamente. Tanto X como S? son variables 
aleatorias, antes de tomar la muestra. Una vez calculadas en una muestra dada, ya son valores particulares de esas 
variables aleatorias, y entonces se les llama estimaciones. 6 


De acuerdo con lo anterior, un estimador es una variable aleatoria y, en consecuencia, tiene una distribución de 
probabilidades. Esto implica que un estimador como X puede, en algunas muestras, estar muy cerca del valor 
de la media poblacional y, en otras, estar muy alejado de ese valor, dependiendo de la varianza de X. Además, 
para cualquier parámetro habrá muchas estadísticas que pueden usarse razonablemente como estimadores. De 
aquí la necesidad de disponer de criterios para comparar el comportamiento de los posibles estimadores. Existen, 
en la teoría estadística, varios criterios de comparación, de los cuales aquí sólo se presentarán dos. El primero se 
refiere al valor esperado del estimador y el segundo a su varianza. 


Por lo que toca a la esperanza de un estimador, una característica deseable es que sea igual al parámetro que se 
desea estimar, es decir, que si O denota genéricamente al estimador de un parámetro 0, se desea que: 


En este caso diremos que 0 es un estimador insesgado del parámetro 0. 
Definición 9.1 (Estimador insesgado). Sean 0 un parámetro de una función de distribución de probabilidades 


y 0 un estimador de 0. Se dice que 0 es un estimador insesgado de si la esperanza matemática de la variable 
aleatoria 0 es igual a 0. En símbolos, si: 


El0)=0 + 


En esta conexión con esta idea es conveniente definir el sesgo de un estimador. 


Definición 9.2 (Sesgo). El sesgo de un estimador Ô para un parámetro 0 se define como: 
s(0)=E(0-0)=El(0)-0 » 


De acuerdo con la definición 9.2, si un estimador es insesgado, entonces s(0)= 0. También es claro que 
si el sesgo es positivo, se sobreestimará sistemáticamente el valor del parámetro, mientras que si el sesgo es 
negativo se subestimará al parámetro. La interpretación es que un estimador insesgado, en un numero muy 
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grande de estimaciones, tiene un promedio que difiere muy poco del valor del parámetro. Por esto es evidente 
la importancia de que un estimador sea insesgado. Sin embargo, a pesar de su importancia, el criterio de 
insesgamiento no puede ser único, ya que para un parámetro puede haber dos o más estimadores insesgados, 
quedando el problema de decidir cuál de ellos es “mejor”, en algún sentido, que los demás. Para motivar 
la siguiente definición considérense los dos estimadores insesgados de un parámetro O cuyas funciones de 
probabilidad se presentan en la Figura 9.1. 


En la Figura 9.1 es evidente que los valores de 0, se encuentran distribuidos más cerca de 0 que los valores de 
Ôi y, por lo tanto, las estimaciones de 0, son más confiables que las estimaciones de Ôi. La razón es que la 
varianza de 0, es menor que la varianza de 01. En este sentido son preferibles estimadores insesgados con la 
menor varianza posible. 


Definición 9.3 (Estimador insesgado de varianza mínima). El estimador insesgado de varianza mínima, como su 
nombre lo indica, es aquel que tiene menor varianza entre todos los estimadores insesgados del parámetro que 
se quiere estimar. 6 


D 
N 


Figura 9.1. Distribuciones de dos estimadores insesgados para el parámetro 0. 
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Ejemplo 9.2. Sea X;,..., Xi una muestra aleatoria donde E(X,)=u y Var(X,)=0?, (í=1,2,...,10). 
Considérense los siguientes estimadores de 4. 


X, +X t+ Xo 


6 =X,;6,=(X, +X,)/2; 0; = 0 =X 
Las esperanzas de los estimadores son: 
ElÓ,)=E(X,)=u 
A 1 l u+ 
El0,)=>E(X +X2)=>5[£(X,)+E(%,)]=* r =p 


E (ô; )= E(X; +. +Xo)= 7 =y 


Por tanto, 01, 02 y 03 son todos estimadores insesgados de u. Las varianzas de los tres estimadores son, sin 
embargo, muy diferentes. Usando el hecho de que X;,..., Xio son independientes, tenemos: 


Varl0, )= RN jay” 


Varl0,) =z [var (x, )+Var(X, )]= do?*Ja=o* 12 


S 
a 0o” 2 
Var (ôs) = [Var (X, )+ =+ Var(X10)] =- ar ias /10 


De modo que 0, es el que tiene menor varianza entre esos tres estimadores insesgados, y 0, tiene menor 
varianza que 0. Esto tiene una explicación intuitiva, puesto que Ê, sólo usa la información de una observación, 
0, la de 2 observaciones, y 0, la de todas ellas. Pero aun con otros estimadores que usan todas las observaciones, 
la media aritmética 0, tiene menor varianza. 


Considérense por ejemplo: 


g, — X1 +X +2X; + Xy +2X; + Xe + Xy +4X4 + Xo + Xio 
4 = — MMMM 
15 


Para este estimador: 


- u+u+2u+u+2u+u+u+4u+u+u 
Elĝ) = LEER TESTA 


15 
z o?’ +0? +40? +0? +40? +0? +0? +160? +0? +0? 
E dr AA a T TI 
225 
j , 
ae *=0.1378 0” 
225 
Por lo que: 
PA 


mE 
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Varl94)=0.1378 0? > Var (ĝ3)=0.10 0? 


Este ejercicio ilustra lo difícil que es obtener un estimador mejor que la media aritmética para la media de un 
modelo probabilístico. De hecho, bajo muy diversas suposiciones sobre el modelo, X es el estimador insesgado 
de varianza mínima. 4 


De acuerdo con la discusión anterior, además de encontrar un estimador para un parámetro, es necesario 
obtener la varianza (o mejor, la desviación estándar) de un estimador, ya que la confiabilidad del mismo 
dependerá de su desviación estándar. La forma de combinar esta información será explorada en las siguientes 
secciones para modelos probabilísticos específicos, y también en conexión con el Teorema Central del 
Límite. 


9.3. Estimación puntual de los parámetros de un distribución Normal 


En una distribución normal los parámetros son u y 0”, la media y varianza de la variable aleatoria. Nos 
referiremos en primer lugar a la estimación de 4. Dada una muestra aleatoria X}, X»... X, de N ( nO? k el 
estimador natural de 4 es la media aritmética. De acuerdo con lo estudiado en el capítulo 7, la media aritmética 
X es tal que: 


X~ Nluo? In), 


por lo que X es un estimador insesgado de 4. Además, se tiene que: 


La expresión anterior nos dice que la varianza del estimador X puede reducirse por el simple expediente de 
aumentar el valor de », es decir, que el estimador sería más confiable con un mayor tamaño de muestra. El 
lector debe recordar que ésa era la forma de disminuir el Error Tipo II en una prueba de hipótesis. La relación 
entre estimación y pruebas de hipótesis que acaba de insinuarse se explorará en detalle al final de este capítulo. 
Por el momento, lo importante es señalar que, dada una muestra, el estimador X debe reportarse junto con 
su desviación estándar. Puesto que 0? es un parámetro desconocido, lo natural es reportar el estimador de 
la varianza, para lo cual es necesario tener un estimador de 0”, lo que nos conduce a la estimación del otro 
parámetro de la distribución Normal. 


El estimador que se usará para la varianza poblacional en la distribución Normal es la varianza muestral: 


Fs 


— S x? - S x/ In 
j= ¡=1 


; i 2 2 2 ; y 
De acuerdo con un resultado obtenido en el capítulo 7, E (s?)=07?, por lo que $” es un estimador insesgado 
de 0”. De hecho ésta es la razón por la que se usa el divisor n — 1 en la expresión del estimador y no el divisor 
n, que podría parecer más natural. El estimador que usa 2 como divisor es un estimador sesgado. 
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La importancia de reportar un estimador junto con su varianza se pone en evidencia si consideramos el siguiente 
problema: dada una muestra X,,..., X, de N ( uo? ), ¿cuál es la probabilidad de que la diferencia entre X y u 
(en valor absoluto) no exceda a cierta cantidad c (c > 0)? En símbolos, queremos calcular el valor de la siguiente 


probabilidad: 


P(X—ujec)=P(=c<X-u<c) 


Puesto que sabemos que /n(X—u)/o tiene una distribución normal estándar, podemos escribir la última 
expresión como: 


ya <Z< > 
O O 
y esta probabilidad puede calcularse de la tabla de la distribución Normal Estándar para cualquier valor de c 


que se desee, siempre que se conozca O. Si O no se conoce como es razonable suponer, basta sustituir $ por O y 
entonces tendremos: 


Eta 


S HU y-1) S 5 


Por el momento y, procediendo como si O fuese conocida, tenemos que si ¢ =Ø / Vn : 


Pl—c<X-—u<c)=P(-0/Vn< X-u<0/WVn) 
=P(-1<Z<1)=0.6826 


Si c=20/WVn: 

P(-20/1V/n<X—u<20/V/n)=P(-2<Z<2)=0.9544. 
y si c=30/1WVn : 

P(-30/V/n<X-—u<30/V/n)=P(=3< Z <3)=0.9974 


Ya que 07 =0/ Vn, esto quiere decir que la probabilidad de que X no difiera de 4 por más de una vez su 
desviación estándar es 0.6826; que la probabilidad de que X no difiera de 4 por más de dos veces su desviación 
estándar es 0.9544, y que la probabilidad de que X no difiera de por más de tres veces su desviación estándar 
es 0.9974. 
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Ejemplo 9.3. Se quiere estimar la media de una distribución normal que “se sabe” tiene una 0? = 9. De acuerdo 
q q 
con esta información sabemos que 07 =3/ Jn . Por los resultados obtenidos en esta sección, la probabilidad de 
que la diferencia entre X y 4 no exceda a 207 =6/ Vn es 0.9544. Es claro entonces que variando el tamaño de 


la muestra podemos hacer la diferencia entre X y 4 tan pequeña como queramos. Los siguientes casos ilustran 
este resultado: 


a) Si n=9; 20/vV/n=2 y, por tanto: 


P(-2 


IA 
<I 
| 

a 
IA 
= 
ll 
o 
Ks] 
Vi 
A 
A 


b) Si n= 36; 20 1 /n =1 y, entonces: 


c) Si n=64; 20 /W/n =0.75 y se tiene: 


P(-0.75< X — u < 0.75) = 0.9544 


d) Si n=576; 20 / Vn =0.25, y: 


P(-0.25< X — u < 0.25) = 0.9544 


Alternativamente se puede fijar la distancia máxima que se está dispuesto a tolerar entre X y 4, y determinar 
el tamaño de muestra necesario para que se tenga cierta probabilidad de lograr el resultado deseado. Como 
ilustración supóngase, en este mismo ejemplo, que se desea que la distancia máxima entre X y 4 no exceda el 
valor 0.4, con una probabilidad del 98%. Simbólicamente se quiere que: 


P(-0.4< X—1<0.4)=0.98 


Estandarizando la variable X — u se obtiene: 


aa a Vn(0.4) 


l = 0.98 
3 3 


Esto es equivalente a escribir: 


Pl=2001 £ Z E zo.01 ) = 0.98 


0.4/n 0.4/n 


Donde 20.01 = 3 y “20.01 = 3 
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De la tabla de probabilidades de la distribución Normal Estándar obtenemos: 


20.01 =2.33 
por lo que: 
y despejando z: 

n = 305.37 


por lo que z = 306 es suficiente para obtener la precisión que se desea. ® 


9.4. Estimación puntual de p en una distribución Binomial 


En una distribución Binomial el parámetro p es la probabilidad de éxito en un intento. El estimador natural 
es entonces la proporción o frecuencia relativa de éxitos en las 7 repeticiones de un experimento Bernoulli. Es 
decir, que si X ~ Bin(n, p) , X es el número de éxitos, y el estimador de p, que denotaremos por ) es: 


P=XIn 


Claramente la estadística 2 es una variable aleatoria y, ya que E(X)=mp y Var(X)= np(1— p), tenemos, 
usando las propiedades de la esperanza y la varianza, 


»p(1=p) _ (12) 


a 1 
o; =Var(P)=Var(X In)= — Var(X) = 
n n n 
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La expresión para Var ( 2) es función de p, por lo que es necesario estimarla. El estimador que se usará es: 


: »(1-?) 
> SS 


Ejemplo 9.4. Para estudiar el porcentaje de desempleo en una gran ciudad se toma una muestra de 375 personas 
y se encuentra que 84 de ellas están desempleadas. Suponiendo que se cumplen las condiciones necesarias 
para usar como modelo la distribución Binomial tenemos que X, el número de desempleados, es tal que 


X ~ Bin(375, p). El estimador de p es: 


A X 
pai 
n 
El valor de X en la muestra es 84, por lo que: 
¿02 
375 


La desviación estándar estimada de p es: 
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ús 2?) _ [02250778 -9.021 i 
P n S75 


Con este tamaño de muestra es razonable usar aproximación normal. Se tiene: 


jana 2] 


y, de acuerdo con los resultados obtenidos anteriormente, la probabilidad de que 7 difiera de p cuando mucho 
por dos veces la desviación estándar de 7 es 0.9544. La desviación estándar estimada de $ es 0.0215. De 
donde: 


P(—0.043 < P — p < 0.043) = 0.9544 ý 


9.5. Ideas básicas de la estimación por intervalo 


En las secciones 9.2 a 9.4 se presentaron las ideas y técnicas elementales de la estimación puntual. La característica 
más importante es que un parámetro se estima por un número, el cual en diferentes muestras puede tomar 
valores muy cercanos o muy alejados del valor verdadero del parámetro desconocido. Para tener una idea de 
esa variabilidad se ha sugerido que un estimador puntual se presente siempre acompañado de su desviación 
estándar y, usando (cuando sea razonable) el Teorema Central (fundamental) del Límite, se establezcan límites 
aproximados para el error del estimador. La idea de la estimación por intervalo es generar una proposición que 
incorpore de manera más explícita la variabilidad inherente al proceso de estimación. Enseguida formalizamos el 
problema: se tiene una muestra aleatoria X}, X,,..., X„ de variables con la misma distribución de probabilidades, 
en la cual hay un parámetro de interés que denotaremos por 0. Sean L y L dos estadísticas. Un intervalo de 
confianza (LE ) para O es tal que, antes de tomar la muestra, la probabilidad de que O € (LE ) es un número 
que denotaremos por 1— &. 

Definición 9.4 (Intervalo de confianza 1— a). Sea X;,..., X;,, una muestra aleatoria de una función de 
probabilidades que depende de un parámetro 0. Sean L y Z dos estadísticas y sea un número entre cero y 
uno. (Z,L.) es un intervalo de confianza 1— æ para 8 si: 


P(L<0<L)=1-a de 


Con respecto a la definición 9.4 haremos en seguida algunos comentarios. 
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La teoría general de la estimación por intervalo es muy complicada, y no se profundizará aquí en ella más 
allá de lo que se ha discutido previamente, sino que presentaremos, en las secciones siguientes, técnicas para 
construir intervalos de confianza para parámetros en las distribuciones Binomial y Normal, y el procedimiento 
correspondiente a la aproximación normal para muestras grandes. 


9.6. Intervalo de confianza para la media de una distribución Normal 


En esta sección discutimos el problema de construir un intervalo de confianza para 4 si se tiene una muestra 


aleatoria X}, X5,..., X, de N mo’). La media aritmética X tiene una distribución Normal (uo In). 
Consecuentemente: 


A N(0,1) 


Puesto que lo lógico es suponer que o° es desconocida, razonando como lo hicimos al estudiar pruebas de 
hipótesis, recurrimos a la distribución + de Student. Tenemos entonces que: 


Va(X-u) 


© tin-1) 


Si se toman valores typ (n—1) y —tap(n—1) en la distribución ż con n—1 grados de libertad, puede 
escribirse: 


P[-tan(n-1)< t, <tan(n-1)]=1-a 


donde *,,_¡ = Va(X-u)IS 


Esto se ilustra en la Figura 9.2. 
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=t (n—1) ta (n—1) 


Figura 9.2. Derivación de un intervalo de confianza para 4 en una Normal. 


Multiplicando por S/ Vn los tres miembros de la desigualdad anterior se obtiene: 


S z S 
Pl=£ =1)<X-—u<—Ftay(n—D)|=1-a 
| p= an(n— 1) u Ja an(n ) 
En vista de que se desea una afirmación probabilística del tipo P(L <u< L) =]1—&, multiplicaremos los tres 


miembros de la desigualdad por —1. Haciendo la operación indicada y sumando X a los 3 miembros de la 
desigualdad se obtiene: 


P[X-(SINn)tan(n-1)< u< XX HS Vm)1, (n=1)]=1-a4 
Un intervalo de confianza (1— æ) para u está dado entonces por: 


[ZAS Ide, 00, X + (51m), (m=1)] (9.5) 


Los comentarios que se hicieron sobre un intervalo de confianza son fácilmente aplicables a este caso particular. 
Por ejemplo, es claro que los límites L y Z son variables aleatorias, ya que X y S lo son y, por tanto, el 
intervalo resultante es aleatorio. Antes de continuar con el análisis del intervalo obtenido presentamos un 


ejemplo. 


Ejemplo 9.5. En el ejemplo 8.1 se presentaron los rendimientos (en toneladas por hectárea) de una variedad de 
trigo en 9 lotes experimentales. Los rendimientos son: 


3.15, 3.92, 4.26, 3.36, 3.72, 4.19, 3.42, 4.38, 4.50 
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Se quiere construir un intervalo de confianza al 90% para el rendimiento promedio de la variedad usando esta 
muestra. Las cantidades necesarias son: X , S, n, ta (n—1). De la muestra obtenemos X = 3.878, S = 0.4895. 
De la tabla E, t} o5(8) = 1.860. Los límites del intervalo de confianza son: 


L=3.878- as 


(1.860) = 3.575 


> 0.48 
L= 3.878+ (1.860) = 4.181 


El intervalo de confianza al 90% es (3.575, 4.181), por lo que podemos concluir que con un nivel de confianza 
del 90%, el rendimiento promedio de la variedad se encuentra entre esos límites. Para ver el efecto del nivel de 
confianza sobre el intervalo usamos ahora los mismos datos para construir un intervalo de confianza al 95%. 
Ahora requerimos +, y5(8) = 2.306, y los límites son: 


0.4895 


L=3.878- (2.306) = 3.502 


: 4 
L=3.878+ 0.308 405% 


y el intervalo al 95% es (3.502, 4.254). 
Finalmente construimos el intervalo de confianza al 99%. En ese caso ty y5(8) = 3.350, y los límites son: 


0.48 
L=3.878- 0.4895 4 350) = 3.331 


y el intervalo de confianza al 99% es (3.331, 4.425). 


Lo más notable en estos intervalos es que la anchura del intervalo (A =1- g) varía con el nivel de confianza 
que se elige. En efecto, cuando 4 = 0.10, A = 0.606; con a = 0.05, A = 0.752; y con & = 0.01, A = 1.094; 
es decir, que el intervalo de valores que consideramos plausible para el parámetro es mayor si deseamos que la 
probabilidad de que el intervalo cubra al parámetro sea mayor. Esto se discutirá en seguida. 6 


La anchura de un intervalo de confianza, que definimos como A = L— L, es una función del nivel de confianza 
que se elija. Esto es claro puesto que: 


A=L-L=[X +(s/ Vr, (m1)]-[X AS 1 M0) 1,17 (10) 
=2(8/Vn)r,,, (11. 0.5) 


Esta expresión indica que mientras menor sea æ, mayor será la anchura del intervalo, puesto que mayor será 
t.1 (1 —1). La interpretación es muy sencilla. Si œ es grande la anchura del intervalo es pequeña, puesto que la 
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probabilidad con la que se afirma que esto ocurrirá es pequeña. Lo contrario ocurre si œŒ es pequeña. Lo anterior 
se relaciona con las probabilidades de Error Tipo I y Error Tipo II, de una manera que se explorará en otra de 
las secciones de este capítulo. 


La anchura del intervalo también depende del tamaño de muestra 2, como se observa en la expresión para la 
misma. Esto se discutirá en la sección 9.8. 


Antes de terminar esta sección debemos recordar que para n grande (» > 30), los valores 1,,,(1—1) y Za 
son prácticamente iguales, por lo que los límites del intervalo de confianza para 4 se pueden aproximar 


por: 
L= T 
y 
L= + Tte 


Los errores que se cometen cuando se usa Z en vez de ż, y n es pequeña, pueden examinarse comparando los 
valores de z«/2 y 1,2 (1—1) en las tablas respectivas. 


9.7. Intervalo de confianza para la varianza de una distribución Normal 


Al derivar un intervalo de confianza para la varianza de una distribución Normal debemos recordar que, si 
X>- X, es una muestra aleatoria de Nlu,o? a? ), la varianza muestral S? es tal que: 


(n—1s? a 


Usando la distribución Yia , podemos entonces encontrar valores 
2 2 
Xan (n= 1) y Xi-a/2(M = 
tales que: 


P| x} an(n-1) < ei < xen(n-1)] AL 


_ (1-15 


s , según se ilustra en la Figura 9.3. 
O 


donde y T% 
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Xy (m1) Xan (n—1) 


Figura 9.3. Derivación de un intervalo de confianza para 0” en una distribución Normal. 


La expresión que se ha establecido debe manipularse para obtener un intervalo de la forma P ( Lag E L) =1-0. 
Puesto que las tres cantidades dentro del paréntesis son positivas, se tiene que: 


1 o? 1 
ie ri ar mes ae a 
Xanln-D (n-1DS% Xian (n—1) 
de donde multiplicando los tres miembros de la desigualdad por (7 —1)S? se obtiene: 


118? _a4ne2 
Xan (n—1) Xi-an (n—1) 


Por lo que el intervalo de confianza resultante es: 


ES (n—18S? ] 


XD” Lian (m1) (9.7) 


En seguida se presenta un ejemplo ilustrativo. 


Ejemplo 9.6. En el ejemplo 8.4 se presentaron 12 mediciones realizadas con un aparato para determinar el 
porcentaje de magnesio en un producto. Las mediciones son: 


5.1, 4.8, 5.2, 5.3, 4.7, 4.8, 4.9, 5.1, 5.2, 4.9, 4.8, 5.3 


j 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Dado que se sabe que el porcentaje de magnesio en el producto es 5%, estamos interesados en la varianza de las 


determinaciones realizadas con el equipo. Se desea construir un intervalo con 95% de nivel de confianza para la 
varianza de las mediciones. De la muestra obtenemos: 


S? =0.0463, 1 =12 


De la Tabla D, vigli 1)= 21.9200 y Lis 1) = 3.8158. Los límites del intervalo de confianza al 95% son: 


11(0.0463) 


L= = 0.0232 

= 21.9200 

— 11(0. 

as 11(0.0463) =0.1335 
3.8158 


El intervalo de confianza al 95% para 0” es entonces: 


(0.0232, 0.1335) 


. ., . 2 + . 
La interpretación es que, con un nivel de confianza del 95%, el valor de 0” se encuentra entre los límites 
establecidos. 4 


Una diferencia notable entre los intervalos de confianza para u y 07 en la distribución Normal es que, en el caso 
de y, el punto medio del intervalo es X, o sea el estimador puntual de 4, mientras que en el intervalo para 07 el 
punto medio no coincide con S 2 Esto se debe a que la distribución de X es simétrica (Normal), mientras que 
la distribución asociada a $° (Ji-cuadrada) no lo es. 


9.8. Correspondencia entre pruebas de hipótesis e intervalos de confianza 


En la sección 9.6 se derivó un intervalo de confianza para 4 en una distribución Normal. El intervalo de 
confianza está integrado por todos los posibles valores de u tales que: 


Re hiuztn—=0 <u< Zafer- 


para un nivel de confianza 1— æ. Por otra parte, la región de rechazo para una prueba de dos colas sobre 4, con 
nivel de significancia æ, está integrada por: 


R=13|5 > pu, +(s/Vm)r, (01) 07 <p ls 1 m)1,2 (10) 
de manera que la región donde Ho no se rechaza es aquélla para la cual: 
o —(siNn)tan(n-1)< F < Mo +51 dnde, (m1) 


O, de otra manera, está integrada por todos aquellos valores de 44, tales que: 
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3—ls/Vnde, (m1) < u <7 + (s/Vn)dr, (m1) 


y esta región de no rechazo tiene, antes de tomar la muestra, una probabilidad 1—« cuando 4= Uy. 
Comparando las expresiones para el intervalo de confianza y para la región de aceptación, la correspondencia 
entre los dos procedimientos es clara. Una hipótesis Ho: 4 = y en oposición a Ha: 4 # Uy, probada con un 
nivel æ de significancia, no se rechazará si 4, es uno de los valores de 4 cubiertos por el intervalo de confianza 
1—a, y se rechazará si 4, es un valor fuera de este intervalo. A continuación se presenta un ejemplo ilustrativo. 


Ejemplo 9.7. En una muestra de tamaño 25 se obtiene lo siguiente: X = 28 y S? = 7.89. Un intervalo de 
confianza al 95% para u está dado por (2, L) donde: 


17.89 


L=28- 0.064) = 26.840 
7.89 


L=28+ 0.064) = 29.160 


Esto quiere decir que la hipótesis Ho: 4 = Uy en oposición a Ha: u # Uy se rechazará, con & = 0.05, para 
cualquier 4, mayor o igual que 29.160 o menor o igual que 26.840, y no se rechazará para ninguna 4y en el 
intervalo (26.840, 29.160). Consideremos el valor 4, = 29. Entonces, la región de rechazo es: 


R=(x%|x > 30.160 o <27.840) 


En la muestra x É R, por lo que no se rechaza Ho con a = 0.05, como era claro desde que se obtuvo el 
intervalo de confianza. 4 


De la discusión anterior se deduce que el nivel de significancia de una prueba de hipótesis y el nivel de 
confianza de un intervalo están íntimamente ligados. De hecho, 1 — Nivel de significancia (a) = Nivel de 
confianza (1— q). Anteriormente vimos (ejemplo 9.5) cómo al disminuir el nivel de confianza (aumentar (2) 
disminuye la anchura del intervalo. En el capítulo 8 (sección 8.10) vimos que aumentar « tiene el efecto de 
disminuir la probabilidad de Error Tipo II. Esto debe interpretarse en intervalos de confianza diciendo que 
si se aumenta &, disminuye la probabilidad de que el intervalo aleatorio ( 5d ) contenga un valor equivocado 
de 0. De igual manera, la anchura del intervalo disminuye si n aumenta. En pruebas de hipótesis vimos que 
esto tiene el efecto de disminuir la probabilidad de Error Tipo II. La interpretación en intervalos de confianza 
es la misma que cuando se aumenta &, es decir, que la probabilidad de incluir valores equivocados de 0 en el 
intervalo disminuye. 


1 
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9.9. Intervalo de confianza para p en una distribución Binomial 


La relación recién explorada entre pruebas de hipótesis e intervalos de confianza puede usarse para construir 
intervalos de confianza para un parámetro. Como un ejemplo se obtendrá un intervalo de confianza 
para p en una distribución Binomial. Para tal efecto considérese el juego de hipótesis Ho: p= p) en 
oposición a Ha: p* p). La regla de decisión para probar esta hipótesis con un nivel æ de significancia 
es: Rechazar Ho si X>c, o X <c, donde c y c, (c, >c) son tales que P(X>c,|p=p,)=a/2 y 
P(X<c|p=p)=a/2, y la región de no rechazo es R“=[x|c,<x<«c) donde 
P(c, < X <c |p= p,)=1—a. De acuerdo con lo discutido en la sección 9.8, un intervalo de confianza 
para p está dado por los valores mínimo y máximo de po, para los cuales Ho no se rechazaría, dado el valor de 
X = k en la muestra. Dicho de otro modo, es necesario encontrar valores p, y p, tales que: 


P(X=k|p=p)=a/2 
P(X<k|p=p,)=a/2 (9.8) 


Una vez encontrados p; y p, tendremos, puesto que p, y p, son los valores extremos de pọ en la región de 

rechazo, que todos los valores entre , integran el intervalo de confianza 1—«% para p. Se tiene entonces 
X yP p 

que (2, 1) , los límites del intervalo de confianza para p, se determinan como sigue: 


= máx (p,» 2) (9.9) 


Para simplificar la determinación de p, y p», la primera de las expresiones en 9.8 puede escribirse: 
P(X<k-1|p=p)=1-0/2 


y entonces p, y p, se obtienen del sistema de ecuaciones: 


P(X<k-1|p=p)=1-a/2 
P(X<k|p=p,)=a/2 (9.10) 
Es decir, p, es el valor de p tal que: 
k-1 


n E n—xX 
5a (1-a) =1-a/2, 


x=0 


y p, es el valor de p tal que: 


2 (a (1—p,)"* =a/2, 


x=0 


Donde k es el valor de Xen la muestra y 1— æ es el nivel de confianza que se desea. La forma de calcular p, y 


pse ilustra en el siguiente ejemplo. 


T- 
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Ejemplo 9.8. Se tienen 16 repeticiones independientes de un experimento Bernoulli con probabilidad de éxito p. 
El número de éxitos en los 16 intentos es 6. Se desea construir un intervalo de confianza al 90% para p. Puesto 
que la variable aleatoria X, definida como el número de éxitos, es tal que X ~ Bin(16, p), estamos en el caso 
discutido líneas arriba. Además, 4 = 0.10 y k= 6. Se deben determinar valores de p; y p, tales que, de acuerdo 
con (9.10): 


P(X <5| p= p,)=0.95 
P(X <6| p= p )=0.05 
Calcularemos primero p,. De la tabla A obtenemos: 
P(X<5|p=0.15)=0.9776 


P(X<5|p=0.20)=0.9183 


De donde deducimos que 0.15< p, <0.20. Explorando el intervalo (0.15, 0.20) para p, obtenemos los 
resultados que se presentan el la tabla siguiente: 


0.1780 0.18 0.20 


0.9475 0.9183 


0.16 0.1775 


0.9504 


0.15 0.17 


0.9588 


0.175 
0.9534 


0.9766 0.9497 


0.9685 


De la tabla anteriores claro que p, es un valor entre 0.1775 y 0.1780. Con la precisión que estamos trabajando 
puede tomarse cualquier valor en ese intervalo. Aquí se tomará p, = 0.178. 


Para evaluar p, empezamos usando de nuevo la Tabla A. De allí obtenemos: 


P(X<6|p=0.60)=0.0583 
P(X<6|p=0.65)=0.0229 


por lo que 0.60 < p, <0.65. En la tabla que sigue se explora ese intervalo. 


0.61 
0.0491 0.0229 


0.6088 
0.0501 


0.6075 
0.0513 


0.605 
0.0535 


0.0583 


Tomaremos p, =0.609, aproximando a 3 decimales. Tenemos entonces que /=0.609 y /=0.178. El 
intervalo de confianza al 90% para p es (0.178, 0.609). Interpretando este resultado desde el punto de vista de 
pruebas de hipótesis diríamos que, dada esa muestra, la hipótesis Ho: p = pọ en oposición a Ha: p% p) no 
se rechaza, con un nivel de significancia del 10%, para ninguna pọ mayor que 0.178 y menor que 0.609. 6 


Un aspecto que vale la pena discutir es la cantidad de trabajo necesaria para determinar p, y p}. En las tablas 
precedentes sólo se han presentado algunos valores convenientemente elegidos de p en cada caso. En realidad, y 
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a menos que se tenga mucha práctica, será necesario determinar P(X < k) y P(X < k—1) para muchos valores 
de p antes de aislar los valores de p; y p, requeridos. Una forma de simplificar el cálculo es usar la Tabla A para 
establecer un intervalo de 0.05 para cada uno de los límites p, y p,, tal como se hizo antes, y en seguida, en vez de 
explorar el intervalo, determinar p, y p, por interpolación lineal. La forma de hacerlo se ilustra a continuación. 


De la Tabla A se obtuvo: 


P(X<5|p=0.15)=0.9776 
P(X <5| p =0.20)= 0.9183 


de donde dedujimos que 0.15 < p < 0.20. Suponiendo que entre p y la probabilidad P(X <5| p) existe 
una relación lineal, observamos (ver Figura 9.4) que p aumentó de 0.15 a 0.20, mientras que la probabilidad 
disminuyó de 0.9776 a 0.9183. Puesto que se busca que la probabilidad disminuya hasta 0.95, el valor pı que 
buscamos es 0.15+x, donde x se obtiene usando las relaciones existentes entre los lados de los triángulos 
rectángulos, Á y B. 


De la figura es claro que: 


0.9776 — 0.9183 _ 0.9776—0.9500 


0.20 — 0.15 x 


P(X <51 p) 


0.9776 


0.15 0.15+x 0.20 


Figura 9.4. Interpolación lineal para p. 


de donde x = 0.023, y el valor aproximado de p, es 0.173. De igual manera, para determinar el valor de Pa 
primero usamos la Tabla A. En ella obtenemos: 


Ere 
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P(X <6| p=0.60) = 0.0583 
P(X < 6| p =0.65) = 0.0229 


y usando el mismo procedimiento obtenemos 0.611 para el valor de p,. El intervalo de confianza aproximado 
por este método resulta ser (0.173, 0.611) contra (0.178, 0.609), obtenido por el método más laborioso. En 
general la aproximación será suficiente para todo propósito práctico. 


9.10. Intervalo de confianza para una media usando aproximación Normal 


De nuevo es el Teorema Central del Límite el que nos permite aproximar resultados para muestras grandes cuando 

se quiere obtener un intervalo de confianza para una media. La teoría es muy sencilla. Para muestras grandes 
V. 2 2 . . . . 

sabemos que X + N(u,o* / n), donde u y 0” son la media y la varianza de cada una de las variables aleatorias 


que integran la muestra. Así, por ejemplo, si se tiene una muestra constituida por variables aleatorias Bernoulli 
2-2) 


|. mientras que si las variables aleatorias son P (4), X = N(4,4/n). En 
n 


con parámetro p, X + N » 


cualquier caso podemos establecer un intervalo de confianza aproximado para la media de la variable aleatoria 
considerada ya que, según se ha estudiado antes, el intervalo con nivel de confianza 1—«* para la media en 
cuestión estaría dado por: 


(Z-(SINn)zan: X + (51 dnd zo) =(X -Sgan + Sgan) 


donde S es la desviación estándar estimada para la variable aleatoria cuya distribución se usa como modelo 
probabilístico. El uso de $ en vez de g no es muy importante en este caso, puesto que se supone que el tamaño 
de muestra es tan grande que usar $ en vez de O (el valor correcto) no modifica apreciablemente el resultado 
obtenido. 


Para ilustrar la discusión previa se considerará específicamente el problema de establecer un intervalo de confianza 
(1—a) para p en una distribución Binomial, cuando 7 es tan grande que no se dispone de tablas para usar la 
técnica exacta discutida en la sección 9.9. Para tal efecto considérese la muestra X;,..., X„ de variables aleatorias 
Bernoulli con probabilidad de éxito p. En esa muestra E(X,)= p y Var(X,)= p(1— p). La media aritmética 
de las 7 variables es (X, +--+X,)/n=X/n donde X, que es el número de éxitos, tiene una distribución 
Binomial (7, p). Por otra parte, X / n es el estimador puntual de p, que se ha denotado por ĵ. Este estimador 
puntual, por una media aritmética es tal que: 


2=N[p,p(1-p)/m] 


por lo que un intervalo de confianza (1—a) para p en una distribución Binomial puede aproximarse por: 


n n 


MéroDoS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Ejemplo 9.9. En el ejemplo 8.6 nos referimos a la proporción de individuos menores de 40 años en una ciudad. 
Se tomó una muestra de 800 personas y se encontró que 600 tienen menos de 40 años. La variable aleatoria X, 
que representa el número de individuos menores de 40 años es Bin (800, p). La media aritmética X /n es 0.75, 
que es el estimador de p. Es decir, P = 0.75. Si se desea establecer un intervalo de confianza al 99% para p, éste 
puede construirse aproximadamente usando los resultados de esta sección. El límite inferior es: 


~  ¡Dl=7 0.75)(0.2 
PA 075 E 575) 07106 
n 800 


a [7 1-7 75)(0.2 
n 


por lo que el intervalo de confianza (aproximado) al 99% es: 


y el límite superior: 


(0.7106, 0.7894) 


Esto indica que la hipótesis Ho: p = p} en oposición a Ha: P % po no se rechaza (con & = 0.01) para ninguna 
Po entre 0.7106 y 0.7894, y se rechaza para cualquier pọ fuera de esos valores. El lector debe verificar que 
Ho: p=0.7 contra Ha: p%0.7 se rechazó (con æ = 0.01) en el ejemplo 8.6. 4 

En el ejemplo 9.9 no es práctico verificar la bondad de la aproximación, puesto que 2=800, y calcular las 
probabilidades exactas sería muy laborioso. Lo haremos con los datos del ejemplo 9.8. El cálculo de un intervalo 


aproximado para p con esos datos se presenta en el siguiente ejemplo. 


Ejemplo 9.10. En el ejemplo 9.8 se construyó un intervalo de confianza exacto para p en un experimento Bernoulli 
con 16 repeticiones. En ese experimento X =6, por lo que el estimador puntual de p es ? =6/16=0.375. 


El límite inferior del intervalo al 90% para p es, entonces, usando aproximación normal: 


- loli? 0.375)(0.62 

PA, 0375 [a 45) 0.1759 
P 16 

¡pla 0.375)(0.62 

e Edd SITE O .645)=0.5741 
n 


y el intervalo de confianza aproximado para p al 90% es, usando 3 decimales: 


y el límite superior: 


(0.176, 0.574) 
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El intervalo exacto es (0.178, 0.609), por lo que la aproximación, sobre todo en el límite superior del intervalo, 
no es todo lo buena que sería de desear. Esto se debe a que el tamaño de muestra es pequeño. Para n = 30, la 
aproximación es sorprendentemente buena. 6 


9.11. Importancia de las suposiciones en la inferencia 


En este capítulo y en el precedente se han estudiado dos técnicas de inferencia estadística: Estimación y Pruebas 
de Hipótesis. La utilidad de estas técnicas depende de su aplicación correcta, y con esto no nos referimos 
solamente a que los cálculos necesarios se hagan con exactitud, a que se consulten las tablas adecuadas o se 
elijan las regiones de rechazo apropiadas, aspectos todos de gran importancia, pero cuya misma obviedad hace 
innecesaria una discusión más detallada. Por aplicación correcta nos referimos en esta sección al siguiente 
aspecto: Toda técnica estadística se apoya en un cierto número de suposiciones. Si estas suposiciones no se cumplen, 
la validez de las técnicas disminuye o es nula. La importancia relativa de las suposiciones no es la misma, ya que 
suponer algunas de ellas cuando no se cumplen no altera radicalmente la validez de las conclusiones, mientras 
que otras suposiciones son tan importantes que, cuando no se cumplen, los métodos que se basan en ellas no 
tienen ninguna confiabilidad. 


Ciertamente un estudio detallado de la influencia de las suposiciones sobre la validez de los métodos excede con 
mucho los límites de esta exposición. En lo que sigue sólo discutiremos brevemente las suposiciones más usuales 
y su importancia relativa en los métodos que se han estudiado previamente. 


Una característica común que comparten las observaciones usadas para aplicar las técnicas de estimación e 
inferencia es que dichas observaciones constituyen una muestra aleatoria de una cierta función de probabilidades. 
Es decir, que se supone independencia entre las observaciones y se adopta un modelo probabilístico. En seguida se 
examina la importancia de estos supuestos. 


a) Independencia. La suposición de independencia entre las observaciones es de importancia capital 
para la validez de las inferencias, y puede decirse que ningún procedimiento estadístico que adopte 
esta suposición es robusto cuando no se cumple. Las técnicas que pueden usarse cuando se tienen 
observaciones dependientes en una muestra son de índole muy especial y no se discutirán en este texto. 
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Existen algunas técnicas para probar la aleatoriedad de una muestra, siendo quizá la más conocida la 
llamada Prueba de Wald-Wolfowitz. El lector interesado puede consultar la referencia 9.1. 


b) Modelo Probabilístico. La afirmación tan categórica que se hizo para independencia, en el sentido de 


que ningún procedimiento es robusto cuando no se cumple, no puede (afortunadamente) hacerse con 
respecto al modelo. Como es fácil verificar, los modelos que más frecuentemente se han sugerido son el 
Normal y el Binomial, que son útiles bajo una gran variedad de circunstancias. Por lo que toca al modelo 
Binomial, el lector debe notar que la variable aleatoria X — Bin(n, p) es la suma de » variables aleatorias 
independientes Bernoulli. Verificar que un experimento aleatorio tiene estructura Bernoulli es muy 
sencillo, de modo que la suposición crucial es de nuevo la independencia. En general hay poca duda de si 
una variable es Binomial o no. En cuanto al modelo Normal, nos referiremos primero al caso de muestras 
pequeñas. Las pruebas de hipótesis e intervalos de confianza para una media son bastantes robustas a 
desviaciones del modelo Normal; es decir, que basta con que las observaciones tengan una distribución 
de probabilidades aproximadamente normal para que las técnicas sean válidas. Desafortrunadamente las 
inferencias sobre la varianza son altamente dependientes de la suposición de normalidad; o sea que las 
técnicas para la varianza no son robustas para esta suposición. En el capítulo 13 se estudiará una prueba 
de hipótesis que nos permitirá decidir si el modelo Normal (o cualquier otro) es un modelo razonable 
para una muestra. En la referencia 9.2 pueden estudiarse técnicas gráficas para decidir si la distribución 
Normal puede servir de modelo para las variables en una muestra. 


Cuando se tienen muestras grandes, las inferencias sobre una media pueden hacerse usando aproximación 
a la Normal, en virtud del Teorema Central del Límite. En ese caso la preocupación principal es de 
nuevo la independencia entre las observaciones. Si éstas son dependientes, existen otras formulaciones 
del Teorema Central del Límite que permiten la aproximación, pero que corresponden a textos más 
avanzados. 


Con las precauciones que se sugieren en los párrafos anteriores, en los capítulos 10, 11 y 12 se analizarán otras 
situaciones experimentales usando como modelo la distribución Normal. En el capítulo 13 se presentarán 
algunas técnicas que no suponen un modelo probabilístico específico y que, en consecuencia, son válidas bajo 
una gran diversidad de condiciones. Dichas técnicas son llamadas No Paramétricas. Aun en esos casos se usa el 
Teorema Central del Límite, cuando no se dispone de tablas suficientemente extensas También allí la suposición 
de independencia será crucial. 
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Ejercicios 
9.1. Sea X, X»... Xy una muestra aleatoria de P (2). Considere los siguientes estimadores de 4: 


1 


0 
2X; 
=] 


0, = X, b: == b; = =5E—, 

n g “> jð 

g Á 
13 


a) ¿Cuáles de ellos son insesgados? Calcule el sesgo cuando proceda. 


b) Calcule la varianza de cada uno de ellos. 


9.2. Considere los dos estimadores insesgados Â; y 03 en el ejercicio 9.1. Evalúe las funciones de 


probabilidades f (9, ) y f (9, ). Para calcular valores de f (9,) recuerde que 2X ¿=1003 tiene 
i=] 


distribución P (104). Suponga que À =2 y aproxime a 3 decimales. 


a) Con los cálculos anteriores dibuje diagramas de puntos para f (9,) yf (ô;). Comente sobre la 
dispersión relativa de las distribuciones. 


b) Calcule P(-1<0, 151) y P(-1<0, 121) 
c) Calcule P(-0.5<0,-4<0.5) y P(-0.5<03-4<0.5). 


d) Examinando sus resultados en b) y c), ¿cuál de los dos estimadores es preferible? ¿Por qué? 


m E 

9.3. En una distribución de Poisson muestre que tanto la media aritmética X = -5 X;, como la varianza 
nia 
i=l 


2 
1 n n 
muestral $? = Aš X? -— È X ] / el son estimadores insesgados de Å. La razón es que en esta 
di i=] 


distribución E(X) = Var(X) =Å. 


Pista: Y X, ~ P (nå), por lo que: 


Var(DX,)=E(3X?)-E(3x,) =n4 


9.4. Los siguientes son rendimientos (en toneladas por hectárea) de raíces de remolacha azucarera en 32 
lotes experimentales. 
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19.61, 21.32, 30.60, 27.48, 25.62, 20.89, 23.71, 28.19, 26.45, 20.69, 24.73, 
29.18, 26.43, 25.76, 29.37, 27.16, 19.83, 27.42, 29.63, 30.02, 24.39, 23.76, 
22.19, 25.38, 28.76, 26.39, 20.09, 26.38, 22.45, 24.17, 28.31, 20.96. 


a) Calcule estimadores puntuales de la media (u) y la desviación estándar (ø) del rendimiento. 
b) Calcule el estimador de la desviación estándar de X. 
- . . ., . . 2 . 
9.5. (Tamaño de muestra. Distribución Normal). Considere el estimador de g? obtenido 9.4 a) como 
un estimador preliminar, y suponga en este ejercicio que puede tomarse provisionalmente como el 
2 2 . LA . - 
valor verdadero de O” (esta es una práctica común para determinar tamaños de muestra). Suponga 
distribución Normal o » lo suficientemente grande como para que pueda aplicarse el Teorema Central 


del Límite. 


a) Verifique que: 


P(-k<X-u<k 


jap kn kxn 


n 
XLS y 
O 


De modo que si se quiere que la probabilidad sea 1d de que un estimador X difiera del valor 
paramétrico 4 por menos de k unidades, y debe ser tal que: 


o bien: 


b) De acuerdo con el resultado en a), ¿cómo es afectado n por k, ø y æ? Ilustre sus conclusiones con 
. . 2 2 . 
los siguientes cálculos [en todos los casos tome como o” el valor estimado en 9.4 a)): 


1) Suponga que se quiere 1d = 0,99, ¿De qué tamaño debe ser la muestra si se quiere estimar 
el rendimiento promedio con un margen de error menor de una tonelada? ¿Menor de media 
tonelada? 


2) Conteste las mismas preguntas que en 1) si se quiere 1d = 0.90 


; Se id r 2 ; 
3) Suponga ahora que su estimación preliminar de varianza fuese S? = 16. Conteste las mismas 
preguntas que en 1). 
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9.6. Sea Xi.» X, una muestra aleatoria de fx(x), con E(X)=0 y Var(X)= 1. Sea 
2 1 2 2 2 
S; = Sj X; -(5 Xx) In). Muestre que S% es un estimador sesgado de 4°. Calcule el sesgo. 
n 
¿Cómo es el sesgo en relación con el tamaño de muestra? Note que los resultados de este ejercicio no 
dependen del modelo probabilístico adoptado para X. 
Pista: Muestre que E(x? ) =3) +07. Además: Var (Y X; ) = pi Var(X;)=nņ", por lo que 


iiS ri =m +n 00”. 


9.7. En un experimento para determinar la toxicidad de una sustancia se administra una dosis de ésta a cada 
uno de 300 conejos y se registra el número de muertos, que resulta ser de 192. Calcule el estimador de 
p» la probabilidad de que un conejo elegido al azar muera a causa de una dosis de la sustancia. Calcule 
la desviación estándar del estimador. 


9.8. Usando aproximación Normal calcule, con los datos del ejercicio 9.7, la probabilidad de 
que el estimador p difiera del valor paramétrico p por menos de 0.05; es decir calcule 


a = 
P(| Pp ls 0.05) = P(-0.05 <p-p< 0.05). Recuerde que el estimador p + nf, pl dl! 
5 > n 
l-2) 


pa 2 2 . 
Para este tamaño de muestra use s3 = ———— en vez de e al estandarizar. 
n 


2.9. Con respecto a los ejercicios 9.8 y 9.7 repita los cálculos si la muestra es de 450 conejos y el número 
de muertos es 288. Comente sobre las similitudes y diferencias en los resultados. 


A Xx 
9.10. (Tamaño de muestra. Distribución Binomial.) Suponga que X ~ Bin(n, p). Sea p =— el estimador 
n 


et-a] 


n 


de p. Para n grande: p+ N | p 


a) Muestre que: 


e A —kÍn baa kn 
bii ia eE z y? (1= p) 


donde Z ~ N(0,1). 


De aquí concluya que, si quiere estimarse p con un margen de error menor que k, con probabilidad 
1, debe cumplirse: 


kn y 
Ja- 


an 
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9.11: 


9.12, 


9.13, 


9.14, 


O bien: 


Zal2 ] 
2 p(l- 
n> pl p)| r ) 


b) Compare el resultado (x) con la expresión para tamaño de muestra obtenida en 9.5 a). Note 
que en 9.5 a) la única incógnita para determinar n es O, mientras que en (x) es p. En ambos 
casos hay un parámetro desconocido que impide determinar el tamaño de muestra deseado. 
Si se tiene una estimación previa del parámetro desconocido (o o p), ésta puede usarse para 
calcular n como se hizo en 9.5 b). Si no se tiene una estimación preliminar de p podemos 
protegernos tomando p = 0.5. Tome un & cualquiera y una % arbitraria, y evalúe » para 
diferentes valores de p entre cero y uno. Grafique n como función de p y cerciórese de que el 
mayor tamaño de muestra se requiere si p = 0.5. 


xw 


Explique por qué el mayor tamaño de muestra para estimar p con cierto márgen de error se 
requiere cuando p = 0.5. 


C 


Suponga que quiere estimarse el porcentaje de analfabetismo en el país de Nunca fué. Se desea 
estimarlo con un margen de error menor de 4% con una probabilidad de 0.98. ¿De qué tamaño debe 
tomarse la muestra si nunca se ha realizado una investigación al respecto? ¿De qué tamaño debe ser la 
muestra si en una encuesta previa se estimó en 0.30 la proporción de analfabetos? Use el resultado (+) 
en el ejercicio 9.10. 


En el ejercicio 9.11 conteste las preguntas si se desea que el margen de error sea menor de 2%. 
Mantenga a = 0.02. 


Cada uno de los siguientes números es el promedio de 4 determinaciones (a diferentes horas del día) 
del contenido de ácido cítrico en la saliva de 15 personas (en mgX100 cc): 


1.07, 0.66, 0.67, 0.82, 0.74, 0.61, 0.99, 1.73, 2.04, 1.41, 1.16, 1.06, 0.64, 
1.54, 1.21 


(FUENTE: Science, octubre 10, 1947. pág. 343). 


Suponiendo distribución Normal (note que los datos son promedios de 4 observaciones) construya un 
intervalo de confianza para el contenido promedio de ácido cítrico en la saliva. Use æ = 0.05. 


¿Cuál es la anchura del intervalo en 9.13? Calcule las anchuras si se toma Y = 0.01 y a = 0.20 ¿Cómo 
se relacionan las anchuras y los niveles de confianza? 
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9.15. Las siguientes son mediciones del contenido de agua en conejos mediante isótopos: 


Cantidad de agua (porcentaje del peso total): 
67.6, 72.6, 71.6, 75.4, 73.0, 77.4, 72.9, 76.2, 68.4. 
(FUENTE: Science, vol. 104, núm. 2694, pág. 158, 16 de agosto, 1946). 


Establezca un intervalo de confianza al 98% para u, la media del contenido de agua. 


9.16. Con los datos del ejercicio 9.15 suponga que quiere probarse la hipótesis: 
Ho:u=73 en oposición a Ha: u #73, 
donde u es la media del contenido de agua, con æ = 0.02. ¿Se rechazaría Ho? La pregunta puede 
contestarse rápidamente de la inspección del intervalo obtenido en 9.15. 
9.17. Generalizando el resultado en 9.16 suponga el juego de hipótesis: 
Ho: U = Uy en oposición a Ha: UA Uy, 
con nivel de significancia æ = 0.02. ¿Para qué valores de 4, se rechazaría Ho, dados los datos del 
ejercicio 9.15? 
9.18. Reiter (Science, 28 de octubre, 1938. pág. 379) ha reportado los siguientes porcentajes de tirosina en 
albúmina de huevo, utilizando un método de medición modificado por él: 
3.77, 3.83, 3.85, 3.81,.3.77,3.83, 3.84 


a) Mediante una prueba de hipótesis (4 = 0.01) decida si las determinaciones obtenidas concuerdan 
con el valor más frecuentemente reportado, que es 3.85. 


b) Construya un intervalo de confianza al 99% para la media del contenido de tirosina. Relacione el 
intervalo obtenido con el resultado de la prueba de hipótesis en el inciso a). 


9.19. En el ejercicio 9.18 calcule los límites del intervalo con un nivel de confianza de 90%. Con a = 0.10, 
¿se rechazaría la hipótesis de que la media del contenido de tirosina es 3.85? 


9.20. En el ejercicio 9.18 es importante conocer la variabilidad del método modificado. Suponga que se toma 
cierta cantidad de albúmina, se homogeiniza y se separa en 13 partes, realizando una determinación en 
cada porción y obteniendo los siguientes resultados: 
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PPAR 


AZAR, 


9.23; 


3.76, 3.74, 3.82, 3.79, 3.83, 3.81, 3.83, 3.80, 3.84, 3.86, 3.78, 3.77, 3.76 
Construya un intervalo de confianza (a = 0.01) para la varianza del método. 
Con los datos del ejercicio 9.20 calcule un intervalo de confianza para 0? usando a = 0.05. Compare 


su anchura con la que obtuvo para  = 0.01. 


En un estudio sobre el contenido de caroteno en un tubérculo (Science, Vol. 103, núm. 2668, pág. 
194, 15 de febrero de 1946) se obtuvieron los siguientes resultados (en mg/100 g): 


6.39, 5.52, 5.05, 4.75, 4.60, 4.13, 3.90, 3.99, 3.90, 3.85, 3.76, 3.65, 
343, 349, 351, 334 3:41, 326, 331. 3.13, 3.11.. 3:03, 2.89, 2:56; 
2.25, 2.01, 1.46, 


a) Construya un intervalo de confianza para la media del contenido de caroteno (a = 0.05). 


b) Construya un intervalo de confianza para la varianza del contenido de caroteno en la especie en 
cuestión (a = 0.05). 


(Tamaño de muestra.) La anchura de un intervalo de confianza para la media (suponiendo distribución 
Normal) es: 


S 
A i > tpa (n—1) 
n 


Suponga que se desea que la anchura sea menor que a. Es decir, que A < a, o dicho de otro modo: 


S 
AS 
n 


(+) 
Si 0? fuese conocida, la condición (*) se convertiría en: 
O 
2 Z n2 < a 
din (xx) 


Por lo que el tamaño de muestra necesario para alcanzar la anchura a es: 


-i [p 1] 
a (or) 


Note que la expresión (+) es idéntica a la del ejercicio 9.5 a, tomando $= 4/2. 


9.24. 


9:25; 


9.26. 


9:27; 


9.28. 
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a) En el ejercicio 9.22 se obtuvo un intervalo de confianza al 95% para la media de caroteno. La 
anchura del intervalo es 0.825. Tome el valor de S obtenido en 9.23 como 0, y use (+*x*x*) para 
determinar el tamaño de muestra necesario para reducir la anchura a 0.500, con una probabilidad 


de 0.95. 


b) ¿Cuál es el tamaño de muestra necesario para reducir la anchura a 0.500 si se desea un nivel de 
confianza de 0.98? 


Para investigar la proporción de personas del sexo femenino que ocupan puestos ejecutivos en un 
ramo industrial se toma una muestra de tamaño 25. Sea X = Número de mujeres (en la muestra) 
que ocupan puestos ejecutivos. Suponga que X ~ Bin(25, p). Si X = 5, construya un intervalo de 
confianza (œ = 0.06) para p. No use aproximación Normal. 


Resuelva el problema 9.24 usando aproximación Normal. 


Sea X el número promedio de accidentes por semana en una carretera y suponga que X ~ P(A). 
40 

De registros existentes se toma una muestra aleatoria de 40 semanas X;, X»... Xyp. Sea Y = > X; 
i=] 


el número total de accidentes en la muestra y suponga que Y = 12. Recuerde que Y ~ P (404). 


Encuentre un intervalo de confianza para À sin usar aproximación Normal (a = 0.10). Imite la técnica 
usada en la distribución Binomial. 


Resuelva el ejercicio 9.26, pero ahora usando aproximación Normal. Recuerde que > X=Y ~ P(nå), 
por lo que aproximadamente: i=] 


De aquí concluya que un intervalo con nivel 1 — & para À está dado por: 


y A E jA 
TAI Zar Falo Zan 
n n n n (+) 


j ; 2 E ds 
Puesto que Å es desconocido, debe usarse el estimador À = — para obtener los límites deseados. 
n 


Usando el resultado (*) en 9.27 encuentre la anchura de un intervalo con nivel de confianza 1 = a 
para Å en una distribución de Poisson, usando aproximación Normal. Sea A la anchura del intervalo. 
¿De qué tamaño debe ser n si se desea que la anchura sea menor o igual que a? 

¿ 
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9.29. 


9.30. 


Lal, 


(Tamaño de muestra. Distribución de Poisson.) Para obtener una anchura menor o igual que 4, en un 
intervalo con nivel de confianza 1 — æ en una distribución de Poisson usando aproximación Normal, 
se requiere que (ver ejercicio 9.28): 


2122, 


a 


En la expresión anterior, al igual que en los ejercicios 9.5 a), 9.10 a) y 9.23, hay un parámetro 
desconocido (en este caso A) que impide calcular el tamaño de la muestra. Si existe un estimador 
preliminar de Å, éste puede usarse para calcular n. 


a) En los ejercicios 9.26 y 9.27, n = 40 y Y = 12, por lo que el estimador de A es 4=0.3. La 
anchura del intervalo obtenido es, con aproximación Normal: 


A=L-—L=0.284 


Suponga que con un nivel de confianza de 0.90 se desea reducir la anchura a 0.14. Use 1=0.3 
como estimador de Å. Calcule z. 


b) Suponga ahora que se desea la misma anchura (0.14) que en a), pero con un nivel de confianza 
de 0.95. Calcule ». 


De un total de 173 163 muertes infantiles registradas en la República Mexicana en 1974, 28 141 
ocurrieron por enteritis y otras enfermedades diarréicas. (Datos cortesía de Julio Boltvinick.) Suponga 
que quiere estimarse la proporción de muertes por estas causas en 1982. Use un modelo Binomial (con 
aproximación Normal). 


a) ¿De qué tamaño debe tomarse la muestra si se desea tener un intervalo para p con anchura menor 
de 0.1, con un nivel de confianza de 0.95? Use el valor (exacto) de p (la proporción de interés) 
determinado en 1974 como estimador del valor actual. 


b) Verifique que el tamaño de muestra determinado en (a) es el mismo que si se hubiera pedido 
estimar p con una diferencia | p— p|<0.05 (ver en el ejercicio 9.10 a) la expresión *). 


Refiriéndonos al ejercicio 9.30, suponga que se toma una muestra de tamaño 750 y se encuentran en 
ella 96 muertes por enteritis y causas afines. Construya un intervalo con 0.98 de nivel de confianza 
para la proporción de muertes. De acuerdo con este intervalo, con un nivel de significancia de 2%, ¿ha 
cambiado la proporción de muertes por enteritis y causas similares de 1974 a 1982? 
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Comparación de dos poblaciones 


10.1. Introducción 


En los capítulos 8 y 9 se estudiaron técnicas de inferencia sobre los parámetros de un modelo probabilístico. 
Inferir sobre los parámetros de un modelo equivale a diagnosticar sobre lo que en ocasiones se llama “el estado 
de naturaleza de un fenómeno”, y tiene una gran utilidad en investigación básica. En las situaciones que nos 
conciernen en este capítulo, se trata de comparar dos estados de naturaleza, es decir, de comparar los parámetros 
de los modelos probabilísticos de dos poblaciones. En los siguientes ejemplos se discuten algunos casos de 
interés práctico. 


Ejemplo 10.1. La obtención de variedades mejoradas de una planta para cultivo comercial es un proceso 
complicado, que requiere de técnicas de inferencia para comparar dos o más poblaciones. Las técnicas para 
más de dos poblaciones no se estudiarán en este capítulo, por lo que por ahora limitaremos nuestra discusión 
al caso de sólo dos de ellas. Suponga que se ha obtenido una variedad que se presume tiene mayor rendimiento 
promedio que la variedad usada comercialmente. Con objeto de decidir si esto es cierto, se realizan experimentos 
de campo en los cuales se siembran las dos variedades en condiciones tan similares como sea posible. Según 
se vió en el capítulo 8, para que la inferencia tenga confiabilidad es necesario sembrar cada variedad un cierto 
número de veces, ya que lo que usualmente sucede es que, aun siendo la variedad mejorada superior a la otra, 
en algunos casos rinde menos. Por ello se requiere una técnica que nos permita decidir, con base en la muestra, 
si el rendimiento promedio poblacional de la variedad mejorada es superior al de la usual. 6 


Ejemplo 10.2. Un fabricante de discos para arado desea uniformar el grosor del filo de los discos que produce, y 
para ese fin quiere probar una nueva maquinaria y compararla con la que actualmente usa. Lo que le interesa es 
que el grosor de los discos producidos con la nueva maquinaria tenga menor varianza que el de los producidos 
con la antigua, por lo que requiere de una técnica de inferencia estadística que, usando muestras, le permita 
concluir sobre la magnitud relativa de las varianzas. 0 


Ejemplo 10.3. Un fitopatólogo desea probar la efectividad de un fungicida preventivo. Para ese fin aplica el 
fungicida a cierto número de plantas y observa si se desarrolla el hongo o no. Lo que registra es la proporción 
de plantas afectadas por la enfermedad. Con objeto de tener un punto de referencia deja un número de plantas 


> 


ES 
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sin tratar y observa también la proporción de plantas afectadas en ese grupo. Para solucionar este problema se 
necesita de una técnica de inferencia que compare las dos proporciones. 4 


En los ejemplos 10.1, 10.2 y 10.3 se examinan casos particulares de tres situaciones genéricas para las cuales 
se desarrollarán técnicas de inferencia en este capítulo. Estas tres situaciones son: Comparación de las medias de 
dos poblaciones, Comparación de las varianzas de dos poblaciones y Comparación de dos proporciones Binomiales. 
Antes de discutir estos casos por separado, es conveniente explicar algunos términos comunes a las tres 
situaciones. 


Primero, consideremos que en los tres ejemplos es claro que se tienen dos poblaciones que han sido generadas 
por la acción de un investigador. En el ejemplo 10.1, mediante un proceso de cruza y selección, el investigador - 
ha creado una nueva variedad. En el ejemplo 10.2 se ha obtenido una nueva maquinaria. En el ejemplo 10.3 se 
tiene un fungicida que puede hacer variar la proporción de plantas infectadas. De manera general diremos que 
el investigador ha generado dos poblaciones mediante el uso de dos tratamientos. Un tratamiento puede ser una 
sustancia, una técnica, un proceso de fabricación, etc. La idea es que el experimentador aplica los tratamientos 
a unidades que reciben el nombre de unidades experimentales. En el ejemplo 10.1 una unidad experimental es 
cada una de las parcelas en que se siembra una variedad. En el ejemplo 10.2 una unidad experimental es cada 
uno de los discos de arado que se fabrican, y en el ejemplo 10.3 una unidad experimental es cada una de las 
plantas observadas por el fitopatólogo. En cada unidad experimental el investigador observa una respuesta. En 
el ejemplo 10.1 la respuesta es el rendimiento (en kilogramos por hectárea) de cada unidad experimental; en el 
ejemplo 10.2 la respuesta es el grosor (en milímetros) de cada filo, y en el ejemplo 10.3 la respuesta es que se 
desarrolle o no la enfermedad en una planta. 


Una vez explicados los términos tratamiento, unidad experimental y respuesta, es posible establecer un marco 
teórico general para las tres situaciones. Dicho marco se bosqueja en seguida. 


No siempre las respuestas se producen por la aplicación directa de tratamientos por parte del investigador. En 
algunas situaciones estas respuestas son directamente observables en estado natural. Éste sería el caso de un 
estudio en que se quiere comparar los niveles de contaminación en dos ciudades. Allí los tratamientos están 
determinados por una serie de condiciones que no dependen del experimentador. En cualquier caso, un aspecto 
muy importante para hacer comparaciones que tengan validez es la manera en que las unidades experimentales 
son asignadas a uno u otro tratamiento. La manera en que se escoge a las unidades que tendrán cada tratamiento 
es llamada un Diseño Experimental o un Diseño de Muestreo. Íntimamente ligado a un diseño experimental está 
el proceso conocido en lenguaje estadístico como aleatorización. Estos términos y su relevancia en la inferencia 
se discuten en la siguiente sección. 
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10.2. Diseño experimental y aleatorización 


Con objeto de introducir las ideas básicas de un diseño experimental presentamos el siguiente ejemplo. Se quiere 
comparar dos diferentes disposiciones de instrumentos en un tablero de control. El experimento consiste en 
colocar a un operador frente al tablero, simular una situación de emergencia y medir el tiempo en que el operario 
ejecuta la secuencia de acciones prevista para esa emergencia. En el experimento descrito, los tratamientos 
son los tipos de tablero que llamaremos A y B, y la respuesta es el tiempo registrado para cada repetición del 
experimento. Supongamos que se va a realizar 10 repeticiones para cada uno de los tableros A y B. Enseguida 
consideramos dos posibles diseños experimentales para el caso. 


a) Muestras independientes. El primer diseño consiste en utilizar 20 operadores, a 10 de los cuales se les asignará 
el tablero A y a 10 el tablero B, y posteriormente comparar los dos grupos de tiempos de respuesta. Un 
problema que parece evidente en este diseño es cómo asignar los tratamientos a las unidades experimentales. 
Es decir, ¿cuáles serán los 10 operadores con los que probaremos el tablero 4? La selección de las unidades 
experimentales para un tratamiento es muy importante, porque en la gran mayoría de las situaciones de 
índole práctica es imposible disponer de unidades experimentales homogéneas, de manera que siempre existe 
la posibilidad de favorecer a un tratamiento asignándole las mejores unidades. En el ejemplo que estamos 
usando es claro que el tiempo de reacción de cada operador es distinto, característica que es independiente 
de los tratamientos. Si usamos a los 10 operadores más veloces para uno de los tratamientos, lo estamos 
favoreciendo, de tal modo que, si resulta superior, no sabremos si se debe a que es mejor o a que se le 
comparó en situación ventajosa. Puesto que es natural que un experimentador tenga preferencia por uno 
de los tratamientos que está comparando, se ha establecido, de manera casi universal, el proceso conocido 
como aleatorización, que consiste en la asignación al azar de los tratamientos a las unidades experimentales. 
En nuestro experimento esto equivale a decir que decidiríamos, mediante un mecanismo aleatorio, cuáles 
operadores usarían el tablero A y cuáles el B. Una forma de efectuar la aleatorización consiste en etiquetar 
las unidades experimentales con los números 1 a 4 (k = 20 en nuestro caso), y colocar 4 fichas idénticas, 
numeradas de 1 a Len una urna. En otra urna se depositan /2 fichas con la letra A y 4/2 fichas con la letra 
B. Para asignar las unidades a los tratamientos, se elige una ficha de la primera urna y una ficha de la segunda. 
De acuerdo con el número que tiene la ficha de la primera urna y la letra que tiene la ficha de la segunda, se 
decide qué tratamiento llevará la unidad experimental identificada por la primera ficha. Ejemplificando: si la 
ficha extraída de la primera urna lleva el número 16 y la ficha extraída de la segunda urna tiene la letra B, se 
asigna al operador identificado con el número 16 el tablero B. Sin reemplazar las fichas extraídas, se repite el 
proceso hasta distribuir los dos tratamientos a las 20 unidades experimentales. 


En la descripción anterior se dijo que en la segunda urna se colocan 4/2 fichas con la letra A y el mismo número 
de fichas con la letra B. Esto se hizo para conformar nuestra explicación al ejemplo, donde se había decidido 
que los tratamientos se probaran en el mismo número de unidades experimentales. En el diseño propuesto no es 
necesario que los dos tratamientos tengan el mismo número de repeticiones. En general diremos que se tienen 2 
repeticiones para un tratamiento y 7 repeticiones para el otro (1 +m= k). Sin embargo, si no se tiene ninguna 
información sobre los tratamientos, es conveniente que » y m sean iguales o aproximadamente iguales. 


La idea detrás del proceso de aleatorización que se ha descrito es que diferencias entre las unidades experimentales 
no favorezcan o perjudiquen exclusivamente a uno de los tratamientos, sino que tengan la misma probabilidad 
de influir en ambos. Esto se consigue no permitiendo que el experimentador elija a su antojo las unidades que 
llevará cada tratamiento. El mecanismo aleatorio de asignación refuerza la credibilidad de la comparación entre 
los tratamientos, al no introducir sesgos sistemáticos a favor de uno de ellos. 
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En el diseño experimental descrito, el método de selección de las unidades experimentales para cada tratamiento 
da origen a dos conjuntos independientes de respuestas, uno para el tratamiento A y otro para el B. Cada 
respuesta es una observación de una variable aleatoria, ya que es imposible saber su valor antes de realizar la 
experiencia. Si se tiene cuidado de que las repeticiones sean independientes, obtenemos muestras aleatorias 
independientes de dos poblaciones posiblemente distintas. En nuestro ejemplo, una precaución elemental para 
asegurar la independencia entre las repeticiones consistiría en que un operador no presencie una realización del 
experimento antes de que le toque su turno. Esta, y otras precauciones que dependen de la situación experimental 
de que se trate, tienen como fin asegurar independencia tanto dentro como entre las muestras que se obtendrán. 


b) Muestras apareadas. El segundo diseño experimental que discutiremos surge de la necesidad de homogeneizar, 
hasta donde sea posible, las condiciones en que se comparan los tratamientos mediante una técnica experimental 
previa a la aleatorización. En el diseño anterior el método de aleatorización es nuestra única precaución para 
evitar que la variabilidad entre las unidades experimentales favorezca a un tratamiento. En este nuevo diseño 
introducimos un refinamiento en la técnica, consistente en formar pares de unidades experimentales, de tal 
manera que las unidades que integran cada par sean tan semejantes entre sí como sea posible, mientras que los 
pares pueden ser muy diferentes entre ellos. Estamos hablando aquí de dos fuentes de variabilidad: la variabilidad 
dentro y la variabilidad entre pares. La variabilidad que se busca minimizar es la que existe dentro de pares. La 
razón es que, en el diseño que ahora discutimos, una de las unidades experimentales en un par cualquiera recibirá 
un tratamiento, y la otra unidad el otro tratamiento. Posteriormente se compararán los tratamientos dentro 
de cada par, de modo que las diferencias entre tratamientos se obtienen en condiciones (presumiblemente) 
más homogéneas que en el diseño presentado en primer lugar. Para ejemplificar nos referimos al experimento 
consistente en comparar dos tableros que se discutió antes. Una forma de llevar a cabo el nuevo diseño en esta 
situación consiste en realizar las mismas 20 repeticiones del experimento, pero ahora utilizando únicamente 
10 operadores. Cada uno de los 10 operadores realizará dos repeticiones, una con cada tratamiento. Con esta 
modalidad buscamos que las diferencias entre tratamientos no se vean afectadas por la velocidad de reacción de 
un operador, ya que lo que se analizará serán las diferencias (en tiempo) para cada uno de ellos. 


También en este diseño la aleatorización juega un papel importante, ya que es necesario determinar cuál de 
las unidades experimentales en el par recibirá uno de los tratamientos. Lo importante de la aleatorización en 
este caso se pone de manifiesto si consideramos que, en el ejemplo que nos ocupa, un tratamiento puede ser 
favorecido si se le prueba siempre en segundo lugar, dado que un operador puede aprender algo de su primera 
experiencia. Similarmente podría argiiirse que es el primer tratamiento el que se ve favorecido, puesto que 
el operador está menos alerta en su segundo intento. Para evitar este elemento subjetivo en la comparación 
se decide, mediante un mecanismo aleatorio, el orden en que cada operador actuará frente a los tableros. En 
general, la aleatorización determina cuál unidad experimental en un par llevará un tratamiento dado. El lector 
debe notar que en el primer diseño cualesquiera de las 20 unidades experimentales podía recibir un tratamiento, 
o sea que se tenía una aleatorización irrestricta, mientras que en el segundo diseño el mecanismo aleatorio está 


restringido por el hecho de que se tienen pares de unidades, y los dos tratamientos deben estar presentes en 
el par, por lo que se tiene una aleatorización restringida. En este segundo diseño, como en el primero, puede 
establecerse una relación unívoca entre el método de aleatorización y el diseño experimental, al grado de que 
puede decirse que un diseño experimental está determinado por el tipo de aleatorización que asigna los tratamientos 


a las unidades experimentales. 


La discusión precedente tuvo la finalidad de mostrar dos formas distintas de comparar dos tratamientos. Un 
análisis apresurado podría llevarnos a la conclusión de que el segundo diseño, al uniformar las condiciones de 
la comparación, es mejor que el primero. Dicha conclusión sería errónea en una gran cantidad de situaciones, 
según se muestra en la sección 10.5. En las secciones 10.3 y 10.4 se presentarán técnicas de análisis para los 
diseños recién caracterizados, con lo que será más fácil entender la comparación entre ellos. Antes de pasar a la 
siguiente sección, mencionaremos que ambos diseños pueden generalizarse al caso en que se quiere comparar t 
tratamientos (+ > 2). En el primer diseño, la única modificación consistiría en que las unidades experimentales 
se dividirían en grupos de unidades de tamaños 2,2)... 2, , de modo que 2 +m +=: +n, = k; y n; unidades 
recibirían el ¿-ésimo tratamiento (í=1,2,...,f) mediante algún mecanismo aleatorio que garantizara que 
cada unidad experimental tuviera la misma probabilidad de recibir cada uno de los £ 

tratamientos. En el segundo diseño tendrían que formarse grupos de * unidades, de 
modo que necesariamente $ es un múltiplo de +. Dentro de cada grupo de £ unidades se 
decidiría, mediante un mecanismo aleatorio, qué unidad recibiría cuál tratamiento, 
asegurándonos de que en cada grupo las ż unidades tengan la misma probabilidad de 
recibir un tratamiento. En este caso general, a cada grupo de ż unidades se le llama 
un bloque y, al igual que cuando 1 = 2, se trata de que las £ unidades que integran 
un bloque sean tan semejantes entre sí como sea posible. 


La técnica conocida como aleatorización fue ideada por Ronald Aylmer 
Fisher (1890-1962), uno de los mayores creadores de la estadística moderna. 
El objetivo de la aleatorización es hacer que las conclusiones que se obtienen 
al comparar dos o más tratamientos sean válidas bajo una gran diversidad de 


condiciones. Ronald Aylmer Fisher 
1890-1962 


MÉTODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


10.3. Comparación de las medias de dos poblaciones 
mediante dos muestras aleatorias independientes 


De acuerdo con lo estudiado en la sección 10.2, si se comparan dos tratamientos usando una aleatorización 
irrestricta, se obtienen muestras aleatorias independientes de dos poblaciones posiblemente distintas. Puesto 
que en en este caso las muestras no son necesariamente del mismo tamaño, las denotaremos por X,..., X,,, y 
Yis.. Y,» En esta sección discutimos el problema de comparar las medias de los modelos probabilísticos para 
las poblaciones respectivas. Nos referiremos en primer lugar al caso muy común en que se supone que el modelo 
para cada una de las poblaciones es la distribución Normal. Las suposiciones para hacer la comparación se anotan 
en el siguiente recuadro. 


El lector debe notar especialmente la suposición implícita en a) y b), es decir, que las dos poblaciones tienen la 
misma varianza, Esta suposición es muy importante porque el procedimiento de prueba que se propondrá no es robusto 
con respecto a dicha suposición, a menos que las dos muestras sean de tamaño muy grande, situación que se discutirá 
separadamente. La suposición de poblaciones normales no es tan importante como la anterior. Por último, es 
necesario señalar que se está suponiendo dos tipos de independencia: el primero dentro de cada muestra (ambas 
son muestras aleatorias) y el segundo entre ellas. 


Una vez especificadas las condiciones bajo las que se operará, pasamos a presentar la técnica de la comparación. 
Se quiere comparar las medias 4 y y 4y. Para ese fin definimos el parámetro ô = Ux — My, o sea la diferencia 
entre las medias. Sea 9 un número cualquiera. Los juegos de hipótesis que interesa probar son: 


a) Ho:0=0, en oposición a Ha: Ò # ô, 


b) Ho:0<Ó0), en oposición a Ha:0>0, 
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c) Ho:092Ó0), en oposición a Ha : ô< ô, 
Muy frecuentemente 0, = 0, en cuyo caso simplemente se trata de decidir cuál tratamiento es mejor. Otros 
valores de Ó, se usan para decidir si la diferencia entre los tratamientos excede a dicha cantidad. 
Puesto que se quiere inferir sobre el parámetro Ô= 4 x T My, parece natural utilizar como estimador de ĝ la 


estadística X —Y . En seguida se obtiene la media y la varianza de la estadística propuesta. Recordemos de 
resultados anteriores que: 


X - N(ux,0? 1) 
Y ~ N(uy, 0? /m) 


o sea que E(X)= uy, VarlX)=0? In, E(Y)=p,, y Var(Y )=0? / m. De aquí se sigue que: 


ElX-Y)=E(X)-E(Y)=u,-u,=0, 


(10.1) 
por lo que X—Y es un estimador insesgado de d. 
Además, por la independencia de las dos muestras: 
A e a E a 
Var XV )=Var (XI) +Var (7) = LE 4 
. E (10.2) 


En seguida establecemos, sin prueba, que la distribución de X —Y' es Normal. De hecho este resultado es un 
caso particular del que se anota a continuación. 


De acuerdo con (10.1), (10.2) y (10.3), la diferencia de medias muestrales tiene la siguiente propiedad: 


2 2 
RP no 22] 
n m 


(10.4) 
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donde Ô= Hy — Uy 


El lector que haya estudiado cuidadosamente las pruebas de hipótesis sobre la media de una Normal no tendrá 
dificultad en reconocer que, a partir de la ecuación (10.4), ya disponemos de las herramientas necesarias para 
probar hipótesis sobre ð. En efecto, si 0” fuese conocida, podríamos hacerlo mediante una prueba de Z usando: 


(X—Y)-0, 
Zy = == 


(10.5) 


Al igual que en el capítulo 8, no es posible usar Z} como estadística, puesto que no es razonable suponer que 

o” es conocida, por lo que es necesario estimarla. En este punto es importante la suposición de igualdad de 

varianzas en las dos poblaciones, ya que en virtud de ella las dos muestras contienen información sobre g. 
e El 

De hecho, si Sy y Sý son las varianzas muestrales de cada una de las muestras tenemos, de los resultados del 

capítulo 7, que: 


. . . . 2 J: . ., . . 
Lo anterior nos indica que un estimador de g^ que utilice toda la información disponible debe tener en cuenta 
a las dos muestras. El estimador que usaremos es: 


$ _ (n—1)S% +(m—DS; 
P ntm-2 (10.6) 


donde: 


SR, 
Il 
Sa 
> 
| 
>< 
= 


2 1 = SAZ 
S =— ET) 


Pr” EET : ; ; 2. ; 2 
el subíndice p en $; indica que la varianza estimada es una media ponderada de Sẹ y Sý, es decir, que S 
y 5 p Y P Xx Y Y Xx 
y S% no tienen el mismo peso en S;, sino que la importancia de cada una de ellas depende del número de 
observaciones en la muestra respectiva, según se ilustra en el ejemplo 10.4. 


2 2 ; A 
Una vez estimada O” por S; este estimador puede usarse en (10.4) para obtener una estadística £, para probar 
hipótesis sobre Ô = 4 y — Uy . En efecto, la estadística: 
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j (10.7) 
siempre que Ô= ô}. 
Con esta estadística tenemos reglas de decisión para las hipótesis a), b) y c) las cuales son idénticas a las 
8 p y 
presentadas en el capítulo 8 para probar hipótesis sobre la media de una Normal, caso en el que nos encontramos 


de nuevo, puesto que Ó es la media de la distribución de X — F. En seguida presentamos las reglas de decisión 
y resumimos los resultados anteriores. 


Al comparar medias poblacionales usando dos muestras independientes X, ,..., X m Y Yis- Ym y suponiendo modelos 
Normales para las poblaciones, procedemos como sigue: 


1) Planteamos uno de los tres juegos de hipótesis: 
a) Ho:0=0), en oposición a Ha:0% 0, 
b) Ho:9<Ó0, en oposición a Ha:ô> Ôp 
c) Ho:0>0), en oposición a Ha : Ô < ôy 


Donde Ò= uy — uy, Ôg es un número arbitrario escogido por nosotros, J Ux y Uy son las medias 
poblacionales. 


2) Calculamos las estadísticas: 


E E , De 1 Le _$vy 
X= ¡25 $ 2 X) 
5_ 156 2 = 1 des _pvY 
am E 8-7) 


me. 
ll 
ue 
~. 
Il 
LA 


3) Obtenemos el estimador ponderado de la varianza (que se supone) común a ambas poblaciones. 


_(n—1)S} +(m—1)S; 
dá a+m-—2 


4) Calculamos la estadística de prueba: 
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5) Puesto que cuando Ô= Ôp, to ~ tim+n-2)> las reglas de decisión para 4), b) y c) son: 
a) Rechazar Ho si tọ >t,,,(n+m>—2) o tọ S—t,,(n+m-=2). 
b) Rechazar Ho si tọ 2 tọ(n+m-—2). 


c) Rechazar Ho si t, € —t;(n+m—2): 


En los tres casos es claro que se rechaza Ho con un nivel de significancia (máxima probabilidad de error tipo I) 
igual a æ. El lector debe notar que rechazar Ho equivale en el juego (a) a concluir que uy # u, +0); en el juego 
(b), a concluir que 4y > u, +0), y en el juego (c), a concluir que 4 y < u, +0,. La interpretación en el caso 
(muy común) en que 0, = 0 se sigue fácilmente. 


En seguida se presentan ejemplos ilustrativos. 


Ejemplo 10.4. En un experimento con plantas de soya se compararon dos tratamientos consistentes 
en proporcionar el riego de auxilio cuando se tenían diferentes niveles de humedad aprovechable en el 
suelo. Para el primer nivel (10%) se usaron 12 unidades experimentales, y para el segundo nivel (40%) 
se usaron 9 unidades. Cada unidad experimental es una superficie rectangular de 7X4 metros, en los que 
se sembró la misma variedad de soya. En lo posible, se trató que las unidades experimentales tuvieran 
constantes los demás factores (fertilización, prácticas de cultivo, densidad de siembra, etc.) que pueden 
afectar el rendimiento, que es la respuesta que se comparó. De cualquier manera, puesto que es imposible 
tener unidades completamente homogéneas, se decidió, mediante un mecanismo aleatorio, qué unidades 
experimentales llevarían cada tratamiento. La aleatorización fue irrestricta, por lo que se obtuvieron dos 
muestras aleatorias independientes. 


Respuestas en kilogramos por Ha 


e? 1735, 2002, 1820, 2082, 189, 

(10% de humedad aprovechable) (X,) 1816, 2008, 1758, 1898, 2223, 
2873, 2313. 

Tratamiento II 3403, 3294, 2899, 3350, 3212, 


(40% de humedad aprovechable) (Y, ) 
2964, 3098, 2984, 2492, 


En este ejemplo hemos asignado la letra Xal tratamiento I. Esta asignación es arbitraria aunque, en el caso 
de hipótesis de una cola, debe notarse que la asignación influye en cuál es la cola de rechazo (ver ejemplo 
10.5). 


La hipótesis que se quiere probar es simplemente que las medias de rendimiento son iguales, contra la 
alternativa de que son diferentes. Es decir, que en este caso 0, = 0, y se quiere probar el juego & de hipótesis. 


O sea: 


Ho:9=0 en oposición Ha: ô #0 
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O, equivalentemente: 
Ho: Uy = Uy en oposición a Ha: Uy Ż Uy 
Las estadísticas necesarias son: 


X =2035.2; Sí =101678.5; n=12 
Y =3077.3; S% =80235.8; m=9 


. O . . . . . ., 2 
En este ejemplo la suposición de varianzas iguales parece justificada por la información muestral, puesto que Sy 
es sólo 1.27 veces Sý. Posteriormente se mostrará cómo probar esta suposición. 


El estimador ponderado de la varianza es: 


ç2 - (11(101678.5)+(8)(80235.8) 
R 19 


= 92650 


Nótese que 5 2 está más cerca de S} que de SẸ. Esto se debe a que SẸ tiene más grados de libertad, es decir, 
que hay se. información sobre g” en la muestra de la población con el primer tratamiento. 


En seguida se calcula £;. 


2035.2-3077.3)-0  —1042.1 
pa AA 8 
1 1 134.2 
92650| — +- 
I2 9 


Elegiremos un nivel de significancia æ =0.01. Con 19 grados de libertad encontramos, en la tabla E, 
toos (19) = 2.861, por lo que la regla de decisión es rechazar Ho si t) > 2.861 o tọ <—2.861. Puesto que 
to =—7.765, la conclusión es que se rechaza Ho con A = 0.01. En realidad el valor de 1, es tan extremo que 
se rechaza Ho con cualquier & razonablemente grande. En contexto del problema la conclusión es que con 
æ = 0.01, las medias de los dos tratamientos son diferentes. De hecho, puesto que X < Y , la evidencia es en 
favor del tratamiento II, o sea, concluimos que Uy > Uy. Y 


Ejemplo 10.5. Una empresa arrendadora de automóviles pretende que los costos de operación de sus unidades 
son menores en más de 40 centavos por kilómetro que los de su principal competidora, la cual a cambio ofrece 
vehículos más cómodos. Un cliente que planea arrendar 500 vehículos decide realizar un experimento. Para ese 
fin arrienda por un mes 20 autos de cada empresa, pidiendo que se le permita elegirlos al azar de entre todas las 
unidades de que disponen. Con el fin de eliminar posibles sesgos, selecciona al azar 40 empleados de su personal 
y asigna aleatoriamente un auto a cada uno de ellos. Después de un mes se registran los gastos de operación. Los 
de la compañía que ofrece menor costo los identificamos con la letra Y, y los de la que ofrece mayor comodidad 
con la letra X. Las observaciones son: 
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—— e + + + + + + + + + 


Tratamiento Costo por kilómetro recorrido (pesos) 

2.80, 2.40, 2.20, 2.85, 2.75, 3.80, 

2.70, 2.75, 2.76, 2.48, 3.01, 3.07, 

Autos económicos (1) 280 232, 279, 235, 246 271, 
2.63, LI- 

2.89, 2.84, 2.96, 3.05, 3.14, 2.99, 

2.90, 2.84, 3.12, 3.42, 3.00, 3.89, 

Amosdehijo (X) 268, 326, 302 260, 382 300. 
1:98, 3.06. 


El arrendatario alquilará los autos económicos si Ô = 4 y — uy > 0.40. Por tanto, se tiene Ôo = 0.40, y el juego 
de hipótesis es: 
Ho : Ò < 0.40 en oposición a Ha: ô > 0.40 


Para probar la hipótesis se toma  = 0.05 


Las estadísticas necesarias son: 
X =3.023; S} =0.1640; n=20 
Y =2.680; S} =0.1445; m=20 
El estimador de la varianza común es: 


_ (190.1640) + (19)(0.1445) 
38 


s =0.15425 


, . . 2 . e . z 
Nótese que en este caso S es el promedio simple de Si y SẸ, debido a que se tiene el mismo número de 
observaciones por muestra. 


La estadística de prueba es: 


_ (3.023—2.68)—0.40 _ 0.057 


i 1NY 0.1242 
015425 +] 
20 20 


Con a = 0.05, el valor aproximado de la tabla de £ con 38 grados de libertad es: 


to.05(38) = 1.687 


por lo que la regla de decisión es rechazar Ho si 1, > 1.687. 


Puesto que tọ = —0.4589, no se rechaza Ho con æ = 0.05. De hecho, puesto que £y < 0, es claro que & > 0.5 y, 
en consecuencia, para rechazar Ho se requiere estar dispuesto a tolerar un nivel de significancia mayor del 50%. 
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El lector debe notar que si se asigna X a los autos económicos, entonces 0, = —0.40, y el juego de hipótesis 
sería: 


Ho : > —0.40 en oposición a Ha : Ô <—0.40 
En este caso: 


_ (2.68—3.023)—(—0.40) _ 0.057 


5 = = 0.458 
fo 0.1242 0.1242 e. 


y ahora la regla de decisión es rechazar Ho si tọ $ — 1.687, por lo que la conclusión es la misma; esto es, que con 

base en la muestra, y con æ = 0.05, no hay razón para creer que el ahorro por kilómetro recorrido es mayor de 
F 

40 centavos con los autos económicos. € 


Una técnica alternativa para comparar las medias de dos poblaciones mediante muestras independientes consiste 
en construir un intervalo de confianza para Ô = UU y — Uy . En efecto, de acuerdo con (10.4): 


ama L+Z) 


n m 


por lo que, estandarizando la variable (X-F): 


ETA on 


Esta variable no puede usarse para construir un intervalo de confianza para Ó, porque o° es desconocida. Sin 
embargo, usando el estimador S , y notando que tiene n — 1 grados de libertad de una muestra y m — 1 de 
la otra, se obtiene que: 


(X-Y)-6 , 
7 Una+m-2) 
IOLI 
s (+++) 
Pin m 


Y, usando el mismo procedimiento que nos llevó al intervalo de confianza para la media de una Normal, 
obtenemos límites de confianza para Ô. El resultado se anota en seguida. 
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Ejemplo 10.6. Construimos un intervalo de confianza (a = 0.01) para la diferencia de medias de los tratamientos 
en el ejemplo 10.4. 


Allí se obtuvo: 


Parcelas con 10% de humedad aprovechable: 


X =2035.2; S =101678.5; n=12 


Parcelas con 40% de humedad aprovechable: 


Y =3077.3; Sí =80235.8; m=9 


Además, S5 = 92650. Puesto que toos (19) = 2.861, obtenemos: 


L= -1042.1 Jo26s0( -£ +2)0.61) =-1426.11 
L=-1042.1+ 12650. +2 )a.561) =-—658.09 


Por tanto, los límites del intervalo de confianza al 99% para Ô= y — Uy son: 


(1426.11, — 658.09) 


De donde concluimos que hay una clara superioridad del tratamiento consistente en regar cuando se tiene 40% 
de humedad aprovechable. 4 


Recordamos al lector que la correspondencia entre intervalos de confianza y pruebas de hipótesis nos garantiza que 
la hipótesis nula Ao:0=0, no se rechaza con un nivel de significancia æ para ningún valor de 0, en el intervalo 
de confianza 1 — æ. Por tanto, la hipótesis Ho:0=0 en oposición a 9% 0 sí se rechaza, con  — 0.01, en el 
ejemplo 10.4. De nuevo es evidente que la estimación por intervalo, al darnos un espacio de valores aceptables para 
un parámetro con un nivel de confianza especificado, es más útil que una prueba de hipótesis. 
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Para finalizar esta sección consideremos el caso en que se tienen dos muestras independientes y los tamaños de 
muestra son grandes. En esta nueva situación, el Teorema Central del Límite nos asegura que la distribución 
aproximada de cada media es Normal, y el resultado (10.3) nos da la distribución de Y — Y. En este caso puede 
evitarse la suposición de igualdad de varianzas en las poblaciones. Supongamos que 07, y g% son las varianzas 
poblacionales respectivas. Entonces: 


(10.10) 


Puesto que tanto 2 como 7 son grandes (digamos que mayores de 30), y estamos en una situación aproximada, 
podemos sustituir las varianzas poblacionales por las muestrales en (10.10) y decir que la distribución aproximada 
es N(0,1). Con dichas modificaciones obtenemos los resultados del siguiente recuadro. 


Ejemplo 10.7. En una zona agrícola existen productores de maíz y de papa. Se quiere comparar la ganancia por 
hectárea entre las dos clases de agricultor en un año dado. Para ese fin se toman muestras de tamaños 65 y 72 
de cada población. Las estadísticas que resumen la información se presentan en seguida, con la ganancia medida 
en pesos. 


Ganancia por hectárea de maíz: 


X =1584.4; S} =61766.69; n=65 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Ganancia por hectárea de papa: 


Y =2068.2; S} =264298.66; m =72 


Con estos datos, los límites del intervalo de confianza (aproximado) al 99% para 4 y — 4y están dados por: 


1766. 298. 
L=(1584.4—2068.2) 2.575 A —658.84 
65 72 
y 
E 69 2 ; 
L= (1584.4— 2068.2) + 2.575 O = —308.76 


Por lo que el intervalo de confianza al 99% es (—658.84, — 308.76). 


Debe notarse en este ejemplo que S es más de 4 veces que SẸ, por lo que la suposición de igualdad de varianzas 
en las poblaciones sería irrazonable. Además, variables tales como ingreso o ganancia difícilmente tienen una 
distribución simétrica, mucho menos normal. Es el Teorema Central del Límite el que nos permite obtener 
conclusiones sobre Ô, dado que los tamaños de muestra son grandes. Por otra parte, la hipótesis Ho: ô = Ôp 
en oposición a Ha :Ô# ò) no se rechaza con æ = 0.01 para ninguna Ôg mayor que —658.84 y menor que 
— 308.76, por lo que hay una fuerte evidencia de que la ganancia es mayor con el cultivo de papa. 4 


10.4. Comparación de las medias 
de dos poblaciones usando muestras apareadas 


En la sección 10.2 se señalaron las posibles ventajas de usar muestras apareadas para comparar las medias de 
dos poblaciones. Los principales argumentos fueron la necesidad de comparar los tratamientos en igualdad de 
circunstancias y la dificultad práctica de tener conjuntos de unidades experimentales homogéneas. Por otra 
parte, si se obtienen pares de unidades semejantes entre sí, pero diferentes entre pares, las inferencias obtenidas 
son válidas bajo una mayor diversidad de circunstancias que si se prueban los tratamientos en unidades 
experimentales idénticas, ya que entonces podría argüirse que las conclusiones sólo son ciertas para las muy 
particulares condiciones que se dan en esas unidades. De cualquier modo, la homogeneización de las unidades 
que integran cada par sugiere la utilización de las diferencias de las respuestas dentro de los pares para realizar el 
análisis estadístico. La estructura de la información resultante se presenta en seguida. 
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De acuerdo con lo anterior es claro que 4p = 0 implica que las medias de los tratamientos son iguales; up > 0 
indica que la media del primer tratamiento es mayor que la del segundo, y 4p < 0, que la media del segundo 
es mayor. 


En primer lugar consideramos el problema bajo la suposición de que D,, D,,..., D, es una muestra aleatoria 


de N (u E ). Posteriormente presentamos el caso en que 7 es grande, y la suposición de normalidad puede 
evitarse. Puesto que se trata de probar hipótesis sobre 4 p y se tiene una muestra, estamos en el caso ya discutido 
en el capítulo 8. Por ser un procedimiento ya conocido el que se usará, no se discute con mayor amplitud, y sólo 
se presenta un resumen. 


Cuando se tienen muestras apareadas, las inferencias sobre los tratamientos se llevan a cabo usando las diferencias 
D; = X; —Y,. Las estadísticas necesarias son: 


e Pre Ma S 
D= D= AD) 


i=l 
Los juegos de hipótesis de interés son: 

a) Ho:Up=k en oposición a Ha: uy *# k. 

b) Ho: up <k en oposición a Ha: up > k. 

c) Ho: 1, >k en oposición a Ha: up < k. 
donde k es una constante elegida por el investigador, siendo común que k tome el valor cero. 


Si se supone que las D; son una muestra aleatoria de N ( At ), entonces se tiene que: 


D-N(up,07 /n) : 


Por tanto, la prueba adecuada es una prueba de t usando la estadística: 
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Vn(D—k) 


la cual tiene una distribución t de Student con n — 1 grados de libertad cuando lp = k. Por tanto, las reglas de 
decisión correspondientes a los juegos de hipótesis a), b) y c) son las de una prueba de t común y corriente, usando 
valores críticos t,(n—1) o t,,(n—1), según el caso. 


Si el tamaño de muestra es grande, puede evitarse suponer que la distribución de D, es Normal. En ese caso, 
apoyándonos en el Teorema Central del Límite, puede usarse la misma estadística ty y realizar una prueba de Z, 


es decir, utilizando las tablas de la distribución Normal estándar. 


Un intervalo de confianza para U p, suponiendo normalidad, está dado por FA L), donde: 


r S 
A 
n (10.17) 


L=D+t nn- 
n 


Vn (10.18) 


Para muestras grandes puede usarse z,,,, en vez de los valores de +. 


Ejemplo 10.8. En la siguiente tabla se presentan las pulsaciones por minuto de atletas, antes y después de una 
sesión de entrenamiento. Se desea inferir sobre el efecto del esfuerzo realizado en el número de pulsaciones. 


CŘ Z 
Atleta 1 2 3 4 5 6 fi 8 9 10 


Pulsaciones antes (Y) 67 61 89 74 69 78 60 78 72 68 
Pulsaciones después (X) 157 158 163 160 161 126 114 148 150 124 
D, = X, Y, 90 97 74 86 92 48 54 70 78 56 


—_—_—_————_————————__________—________——_—_———__——__ _— _— Q_ Q__ _  o.>o.— 


FUENTE: Adaptado de *' Información Científica y Tecnológica”. Vol. II, núm. 25. 15 de julio, 1980. 


Usando las diferencias calculamos las estadísticas: 


D =74.5 y Sp =17.26. 


De aquí podemos construir un intervalo de confianza para 4p. En este caso n = 10, y para un intervalo de 
confianza al 90% obtenemos, de la tabla de z, to.05s(9) =1.833. Por tanto: 


17.26 
L=74.5-(1.833)| == |= 64.50 
L=745-0.033)| 72) 


- 17.26 
L=74.5+(1.833)] — | = 84.50 
l | v10 
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y el intervalo, con un nivel de confianza de 90%, es (64.50, 84.50). 


Puesto que el intervalo de confianza al 90% no contiene el valor cero, es claro que la hipótesis nula en el juego 
Ho: up =0 en oposición a Ha: Up #0 se rechazaría con « = 0.10. De hecho existe fuerte evidencia de un 
aumento en el número de pulsaciones debido al entrenamiento. Supongamos ahora que se desea decidir si el 
aumento es mayor de 65 pulsaciones. Para ese fin probamos el juego de hipótesis: 


Ho: uy S65 en oposición a Ha: up > 65 


con æ = 0.10. Nótese que la conclusión para esta hipótesis no puede derivarse del intervalo de confianza 
obtenido previamente, puesto que ahora la hipótesis es de una cola. 


La estadística para la prueba es: 


npr /10(74.5—65) -r 
1726 


De la Tabla E obtenemos +, ¡/(9) = 1.383 , por lo que se rechaza Ho con æ = 0.10, y se concluye que el aumento 
es mayor de 65 pulsaciones, con un nivel de significancia de 10%. 6 


En el ejemplo anterior aparentemente se tiene un sólo tratamiento. Sin embargo, debe notarse que existen dos 
situaciones en las que se mide la respuesta. Una es antes y otra después del entrenamiento. En estas condiciones 
se dice que se tienen un tratamiento y un testigo, o que el segundo es un tratamiento testigo. Otra característica 
del experimento descrito consiste en que los dos tratamientos se aplican al mismo individuo, o sea que la misma 
unidad experimental física recibe los dos tratamientos, situación similar a la del experimento de los tableros 
descrito en la sección 10.2. Esto no siempre es conveniente hacerlo, puesto que muy a menudo origina que 
se confunda el efecto de los tratamientos, como ocurrirá si se aplican al mismo individuo dos antibióticos que 
se desea comparar. Por otra parte, experimentos donde se compara un tratamiento contra un testigo son muy 
frecuentes, pero lo usual es que las dos unidades experimentales que integran un par sean físicamente distintas. 


La idea de utilizar bloques, es decir, grupos de unidades experimentales homogéneas, surgió inicialmente en 
experimentación agrícola, donde un criterio de agrupamiento común es la fertilidad del suelo. Otras situaciones 
típicas ocurren cuando las unidades experimentales son seres vivos. En ese caso se busca que las características 
físicas o mentales, según el tratamiento, sean similares en los miembros del bloque. Así, si se van a comparar 
dos métodos de enseñanza, lo ideal sería tener mellizos idénticos, o al menos hermanos. Si se va a comparar la 
duración de dos formulaciones de pintura para señales de carretera, lo conveniente es probarlas mediante rayas 
dobles en el centro de la misma carretera, etc. 


En todos los criterios de agrupamiento, a pesar de la homogeneización previa lograda por el uso de bloques, 
la aleatorización dentro de cada bloque es importante, puesto que las unidades experimentales que forman 
el bloque son parecidas pero difícilmente idénticas. Considérese el ejemplo de las pinturas para carretera, y 
supóngase el caso (improbable, pero no imposible) en que la circulación en un sentido es mayor que en el otro. 
La asignación sistemática de una pintura a una dirección la pondría en ventaja o desventaja. 


A pesar de lo que se ha dicho, no siempre es posible asignar aleatoriamente las unidades de cada bloque a los 
tratamientos, como es evidente en el ejemplo 10.8. Allí se tiene una situación en la cual necesariamente el 
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tratamiento testigo precede al otro. Puesto que en ese caso las unidades experimentales que forman un bloque 
son “individuo antes” e “individuo después”, la aleatorización es imposible. En circunstancias como ésta el 
investigador debe utilizar su criterio para decidir si no hay otro factor ajeno a los tratamientos que pueda viciar la 
comparación. El ejemplo 10.8 se eligió deliberadamente para destacar estos problemas, aunque la comparación 
parece razonable a pesar de no ser posible la aleatorización. 


10.5. ¿Muestras independientes o apareadas? 


Al final de la sección 10.2 se comentó que la técnica experimental consistente en formar bloques no 
necesariamente es “mejor” que la de usar dos muestras independientes. En este apartado argumentamos 
brevemente sobre esta afirmación. En primer lugar es necesario aclarar qué entendemos por “mejor”. Para 
ese fin debemos recordar que mediante los dos procedimientos propuestos se trata de comparar dos medias 
poblacionales, que hemos llamado ty y Uy, y el parámetro de interés es, consecuentemente, U y — Uy. En 
ambos casos la estadística para la inferencia es X —Y, llamada D en el segundo caso. Es claro entonces que se 
tiene mayor información sobre 4 y — Uy mientras menor sea la varianza de X —Y . De hecho en ésta, como 
en cualquier otra situación en que se tiene un estimador para un parámetro, todo refinamiento en la técnica 
tiene como propósito disminuir la varianza del estimador, puesto que ello tendrá como consecuencia hacer 
estimaciones (de punto y por intervalo) más precisas. Con estas ideas en mente examinamos el efecto del 
apareamiento sobre la varianza de X —Y . 


En primer lugar consideremos el caso en que se tienen dos muestras independientes. Entonces: 


Var(X -Y)= Var(X)+Var(¥) 


En cambio, con muestras apareadas: 


Var(X —-Y)= Var[X)+Var(Y)-2Cov(X,Y) 


De modo que la varianza con muestras apareadas se reduce siempre y cuando se tenga covarianza positiva 
entre las observaciones dentro del bloque. Por supuesto que ésta es la idea implícita cuando se busca que las 
condiciones dentro del bloque sean homogéneas, puesto que si en un bloque las condiciones son favorables 
para ambos tratamientos, la respuesta será alta (aunque en distinta medida) en ambos casos. La misma relación 
ocurrirá si las condiciones son desfavorables. De aquí que la efectividad del apareamiento dependa de la medida 
en que se ha logrado la homogeneización. 


Con todo, lograr una reducción (aunque sea pequeña) en la varianza de X —Y es relativamente fácil, y se 
requeriría un desconocimiento absoluto del material experimental para aumentarla. Sin embargo, no es 
suficiente disminuir la varianza del estimador para lograr mayor precisión en las inferencias sobre u x` My. 
EI hecho es que al aparear las observaciones se paga un precio que puede ser mayor que la ganancia obtenida al 
disminuir la varianza, según se discute en seguida. En efecto, en ambos casos el intervalo de confianza para la 
diferencia de medias poblacionales es de la forma (L, L), donde: 


L=(X Pt. (WS7_p (10.19) 


L=(X-F)+ tan (v)S7 7 (10.20) 
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Para que el lector se percate de que tanto las ecuaciones (10.8) y (10.9) como las (10.17) y (10.18) son casos 
particulares de (10.19) y (10.20), es preciso considerar que, en el caso de (10.8) y (10.9): 


se? e? 
R È 2 2 2 
—+— = E +S5 = $5 F 
n m X y X= 
y en el caso de (10.17) y (10.18): 
Sh _ 5 


No obstante, hay una diferencia fundamental entre (10.8) y (10.9), comparadas con (10.17) y (10.18). La 
diferencia consiste en los grados de libertad de la distribución de ż que se usa para la construcción del intervalo. 
A dichos grados de libertad les hemos llamado genéricamente v en (10.19) y (10.20); sin embargo, son diferentes 
para muestras apareadas y muestras independientes. Para que la comparación sea válida debemos tener el 
mismo número de unidades experimentales en ambas situaciones, y este número debe ser par. Digamos que 
se tienen 2k unidades experimentales, por lo que el número de grados de libertad en muestras independientes 
es 2—2=2(k—1). En el caso de muestras apareadas trabajaríamos con las k diferencias Dj, D)»..., D;,, y en 
consecuencia se tendrían sólo k — 1 grados de libertad, o sea la mitad que en el caso anterior. El lector debe 
verificar, de la Tabla E, que para cualquier æ el valor de ż4(v) disminuye cuando aumenta el valor de v. En 
consecuencia, el valor de +,,(v) será siempre mayor en el caso de muestras apareadas. Tenemos entonces dos 
factores que considerar: uno es la varianza de X-Y, y el otro el valor de £,¿(v). En seguida examinamos su 
efecto sobre la anchura del intervalo resultante en los diseños estudiados previamente: la disminución de la 
varianza de X —Y, que generalmente se logra mediante el apareamiento, tiene el efecto de reducir la anchura del 
intervalo de confianza para uy — Hy. Por otra parte, la pérdida de grados de libertad que trae como consecuencia 
la aleatorización restringida aumenta dicha anchura. Puesto que la precisión de la estimación se refleja de 
manera inequívoca en la anchura del intervalo, es claro que para ser mejor diseño, el de muestras apareadas 
debe disminuir la varianza de X —Y en magnitud tal que compense el aumento de 2, (V), ocasionado por la 
disminución de los grados de libertad. 


10.6. Comparación de las varianzas de dos poblaciones Normales 
En varias secciones de este texto hemos discutido situaciones donde el parámetro de interés es la varianza de 


una población. En particular, en el capítulo 8 se presentaron técnicas para construir intervalos de confianza y 
. + . 2 ., ., . . . 
probar hipótesis sobre 0” en el caso de una población Normal. En esta sección se discuten procedimientos para 


1% 


MÉTODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIC 


Infante-Gil y Zárate de Lara 
comparar las varianzas de dos poblaciones Normales. Antes de iniciar la presentación subrayamos el hecho de que los 
métodos de esta sección dependen fuertemente de la suposición de que las poblaciones de las que se toman las muestras 
son Normales. Es decir, que las inferencias no son robustas con respecto a la suposición distribucional. 
La estructura de los datos necesaria para la comparación se presenta enseguida: 
2 
a) X;,..., X, es una muestra aleatoria de N(ux, 0% ). 
: 2 
b) Y,,...,Y,, es una muestra aleatoria de N (uyo? ). 


c) Las muestras son independientes. 


; 2 2 
Los estimadores naturales para O% y Oy son: 


7% 
II 
¡Ms 
~ 
>< 
l 
>| 
N 
N 


m=1 2 
Además, sabemos que: 
(DS  , 
2 ~ Xín-1) 
O% 
y 
(m—DS7 3 
2 (m—1) 
0; 


Y, en consecuencia, dado que las dos muestras son independientes: 


2 2 
Sy / Oy 
2 2 
Sie 


y, además: 


é 
3 p 
Si /0% 


m-l 
n=l 


De aquí que la distribución de F nos permita probar hipótesis sobre los tamaños relativos de las dos varianzas. 
Las hipótesis de interés son: 
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O% 
l.a) Ho: > <1 en oposición a Ha: 
Oy 


e yA 


Cy 104 
2.b) Ho: ET en oposición a Ha: L<1 


2 2 
o% 0; 
2 a? 
3.0) Ho: x =1 en oposición a Ha: x 1 
Oy Oy 


El lector debe notar que la hipótesis alternativa en 4) equivale a decir que 0% > 07, mientras que en $) implica 
2 2 . . . . Sia 
que o% <0;, y en c) indica simplemente que las dos varianzas son distintas. 


> ld 2 ld 
De acuerdo con resultados previos sabemos que si O% = 0%, entonces las estadísticas: 


$> 
A=% 
Sy 
be 
e. 3 
== 
Sx 


tienen ambas la distribución de F, la primera con n — 1 y m — 1 grados de libertad, y la segunda con m — 1 y 
n — 1 grados de libertad. Es decir, que los grados de libertad del numerador y denominador se intercambian. 
Es claro entonces que una prueba de tamaño & para el juego de hipótesis 4) puede hacerse mediante la 
estadística Fp, con la regla de decisión: 


Rechazar Ho si F, > "—Ug) 


m-1 


con lo que se tiene una prueba de la cola derecha. Para el juego b) podría utilizarse también la estadística Fo, 
dando como resultado una prueba de la cola izquierda. Sin embargo, para ahorrar espacio, lo usual es que las 
tablas de F sólo den valores críticos en la cola derecha de la distribución. Por esta razón el juego de hipótesis 5) 
se prueba mediante la estadística F`, con la regla de decisión: 


Rechazar Ho si E, > F” (a) 


n= 


Para el juego c) de hipótesis requerimos valores críticos en las dos colas de la distribución, y puede usarse 
cualquiera de las estadísticas F} o F} . Por ejemplo, usando F) la regla de decisión es: 


REKID a 
F, < FI (1-a/2) 


Rechazar Ho si 
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La prueba no puede realizarse con la regla de decisión propuesta debido a que las tablas F a I sólo dan 


valores críticos en la cola derecha. Para resolver este problema notamos que E!Z|(1—a/2) debe ser tal 


que: 
P| R < EZ 1=a/2)]=4/2 
De donde: 
i 1 
Ne of 
K ES (1—-a/2) 
l y 
Pero E = F, y, por tanto, tiene la distribución de F con (m — 1) y (2 — 1) grados de libertad. Por lo que se 
0 
tiene que: 
š 1 
Al 2 ua =012 
m- (1/2) (10.21) 
Pero, además, con nuestra notación: 
LS m-l = 
P| F > EM a 12)]=a/2 e” 


De (10.21) y (10.22) se deduce que: 


al 1 
En al2= == 
7 (1 =l 2) 
O sea que: 
n—1 1 
EN (-a/2)= — 
En erz) 


El resultado anterior nos permite establecer la regla de decisión para el juego de hipótesis c) como sigue: 


Rechazar Ho si E, > Fl (412) osi A < 


m= 


F al?) 


n—1 


Antes de ofrecer ejemplos ilustrativos presentamos la forma general del resultado que nos permitió establecer 
la regla de decisión para una prueba de dos colas, utilizando sólo puntos críticos en la cola derecha de la 
distribución de F. 
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Ejemplo 10.9. En el ejemplo 10.4 se compararon las medias de dos muestras independientes bajo la suposición de 
que las varianzas son iguales. Probaremos ahora esta hipótesis mediante una prueba de dos colas, con æ = 0.10. 


Las cantidades necesarias son: 


S; =101678.5, n=12 
SÈ =80235.8, m=9 


Se desea probar: 


T 0” 
Ho: £=1 en oposición a Ha: #1 
Oy Oy 
La estadística F} toma el valor: 
101678. 
80235.8 
Los valores críticos son: 
Fa (0.05) =3.31 
y 
11 1 
Fa (0.95) = = 0.3392, 


F8 (0.05) 2.9480 
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y la regla de decisión consiste en rechazar Ho si F) 23.31 o si F) <0.3392. Puesto que F, =1.267, la 
conclusión es que, con 4=0.10, no hay razón para rechazar la hipótesis de varianzas iguales, y se justifica la 
ponderación de las varianzas efectuada en el ejemplo 10.4. 4 


Ejemplo 10.10. En el ejemplo 10.7 se compararon las medias de dos poblaciones usando dos muestras 
independientes. Las estadísticas que resumen la información de las muestras son: 


X =1584.4, S} =61766.69, n=65 
Y = 2068.2, S} =264298.66, m = 72 


Estos datos ejemplifican una situación que es mucho más frecuente de lo que sería deseable, y que consiste en 
que muy a menudo la varianza aumenta cuando aumenta la media. 


Con propósitos ilustrativos probaremos la hipótesis: 


> 


. iia * Y 2 2 5 n . Ss 
Para trabajar en la cola derecha usamos la estadística Aj =>, la cual, cuando 0% = Øg}, tiene la distribución 
X 
71 T 71 ; : ? 
Fó4 - El valor crítico F4 (0.05) no aparece en la tabla correspondiente. Sin embargo, el lector puede verificar 


que Fé (0.05)=1.5343 y F? (0.05)=1.3519, por lo que F% (0.05) es un valor intermedio entre esos 
264298.66 
61766.69 


varianza de la población identificada con la letra Y es mayor que la de la identificada con letra X, por lo que 
sería irrazonable ponderar las varianzas muestrales para obtener un estimador único para la varianza de las 
dos poblaciones. + 


dos. Puesto que £, = = 4.279, es claro que se rechaza Ho con 4=0.05, y se concluye que la 


Otra forma de comparar las varianzas de dos poblaciones Normales consiste en establecer un intervalo de 
confianza para o% / 07. El método es muy sencillo, puesto que sabemos que: 


Slot 
Sio 


n—1 
m-l 


bajo la estructura de los datos establecidos para esta sección. Por tanto: 


sIla 
P| E0- A T a/2)|=1-4 
; 


De donde: 
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" Sor 
p| ra-ara pa 
Yx 


z <szta/a| aia 


Y también: 


2 2 2 
Sx 


š Sri l-al2) _ 0) - SiEn(a/2) a 
Ox Sx 


Y, en consecuencia: 


S$ 0% S% " 
SEMI) o SETA aa,” 
Y+ m-l ye Y+ m-l a 2) 


Con objeto de usar directamente las tablas de F en este texto usamos la expresión (10.23) para obtener: 


2 2 2 pm-1 
rr a 
SRT e $ 


El resultado anterior se presenta formalmente en seguida. 


Ejemplo 10.11. Enseguida se construye un intervalo de confianza al 90 por ciento para 0% / 0}, utilizando los 
datos usados en los ejemplos 10.4 y 10.9. Las cantidades necesarias son: 


T 
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S} =101678.5, n=12 
S? =80235.8, m=9 


De las tablas obtenemos: 


Fa (0.05) =3.31 
F1 (0.05) = 2.9480 


De donde: 
1 k 
—  80235.8 3.31 
— 101678. 
JA 1016785 a ogo) = 3.7358 


80235.8 


El intervalo de confianza al 90% para 0% / 0% es (0.3829, 3.7358). El lector debe notar que el intervalo de 
confianza incluye el valor uno, por lo que la hipótesis o% = 0% no se rechaza con æ = 0.10, según encontramos 
en el ejemplo 10.9. 6 


10.7. Comparación de dos proporciones Binomiales 


El estudio de situaciones donde los elementos de la población objetivo de la inferencia sólo pueden separarse 
en dos categorías ha ocupado buena parte de las páginas de este texto, y en los capítulos 8 y 9 hemos 
presentado técnicas para inferir sobre el parámetro p de la distribución Binomial que resulta cuando se 
efectúan repeticiones independientes de un experimento Bernoulli con probabilidades iguales de éxito en 
cada repetición. En esta sección se presentan métodos elementales para comparar las proporciones de éxitos 
en dos poblaciones Binomiales. En esencia se trata de comparar dos poblaciones en una situación donde 
lo único que puede medirse es si el evento de interés ocurrió o no en cada una de las repeticiones del 
experimento; es decir, que la respuesta observada es de tipo cualitativo, a diferencia del resto de los casos 
de este capítulo, donde las respuestas en cada unidad experimental son cuantitativas. Ejemplos donde las 
técnicas de esta sección serían útiles son: comparar las proporciones de insectos muertos en dos lotes a 
los que se ha aplicado distintas formulaciones de insecticidas; comparar las tasas de incidencia de una 
enfermedad en dos regiones geográficas; comparar las proporciones de enfermos de cáncer en individuos 
fumadores y no fumadores, etc. 


La estructura de los datos necesarios para la comparación puede establecerse de manera sencilla. Se tienen dos 
poblaciones que pueden haberse generado por la acción de dos tratamientos administrados por el investigador, 
por un tratamiento y un testigo, o ser simplemente dos poblaciones que ya existen en estado natural. Ya sea por 
la naturaleza de la respuesta que se estudia o porque la capacidad de medición del experimentador es limitada, 
lo único que puede medirse en cada unidad experimental es si ocurrió o no cierto evento. En cada una de las 
poblaciones se toma una muestra aleatoria que; para efectos de identificación, diremos que es de tamaño » en 
la primera población y de tamaño » en la segunda. Las muestras se toman de manera que se tiene dos muestras 
independientes. En la primera muestra los elementos son X,,X,,..., X,,, y en la segunda los denotaremos por 
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Y, ,Y,,...,Y,, . Dadas las suposiciones que se han hecho es claro que las X; son variables aleatorias independientes 
Bernoulli con la misma probabilidad de éxito, que identificaremos por p}. Similarmente las Y, son variables 
aleatorias independientes Bernoulli con probabilidad de éxito p,. Es claro que las probabilidades p, y p, se 
refieren a la ocurrencia del mismo evento bajo dos condiciones experimentales distintas, por lo que se trata 
de comparar, usando las muestras, los valores de p} y p,. De acuerdo con lo estudiado en el capítulo 9, los 
estimadores puntuales de p, y p, son: 


a A 
> AA 
n 
y 
A -A 
1 Bi > 


donde X = X, +X, ++X, y Y =Y, +Y, +--+Y,,. De resultados anteriores sabemos además que: 


X~ Bin(n, p, ) 


Y né Bin(m, px) 


Todo lo anterior se resume en el siguiente recuadro. 


Puesto que X ~ Bin(n, p,) y Y ~ Bin(m, p, ), es claro que: 
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y 
ON 
Además: 
Var(p,)= Var[ 2) = Var x=2 E pi) 
y 


z =p 
Var(p,)= Var|*) = —Var(Y) = _— 


Dado que P, y p, son estimadores obtenidos en dos muestras independientes se tiene: 


El?,-?,)=E(2,)-E(7,)= 2- 2> (10.27) 


Var( >, -7,) = Var( >, )+var(>, ) = all-a) 20-A) 


n m 


El resultado (10.27) nos permite derivar técnicas de inferencia para comparar p, y p,, es decir, para comparar dos 
proporciones binomiales. Los métodos presentados en esta sección son aproximados, puesto que se apoyan en 
el Teorema Central (fundamental) del Límite. En consecuencia, el lector debe recordar que sólo son confiables 
cuando los tamaños de muestra en las dos poblaciones son grandes. En efecto, el Teorema Central del Límite 
nos asegura que para 2 y m grandes: 


"o a(l- p) 
Î, -na 2020] 


n (10.28) 
y 
x p(l- p) 
m (10.29) 


puesto que tanto fp, como p, son medias de variables aleatorias independientes. En consecuencia, de acuerdo 
con (10.3) se tiene que: 


n m 


"TN AA)  p(1-p,) 
(0-2) ap AEA et-a) 
(10.30) 
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La expresión (10.30) es muy importante para comparar dos proporciones binomiales, dado que probar hipótesis 
o establecer intervalos de confianza para p, — p, es un problema que ya se ha tratado previamente al establecer 
técnicas de inferencia para la media de una variable aleatoria Normal. Consideraremos primero el método para 
probar hipótesis comparando las proporciones p, y p}. Las hipótesis de interés son: 

a) Ho: p — p, =0 en oposición a Ha: p — p, 40 

b) Ho: p,— p, <0 en oposición a Ha: p — p, >0 

c) Ho: p — p, 20 en oposición a Ha: p — p, <0 


[El lector debe notar que la hipótesis alternativa en a) establece la diferencia entre >; en el caso b), la 
q P 1 Y Po 
hipótesis alternativa implica que p, > p», y en c), afirma que p, < p3]. 


Para generar una estadística de prueba debe notarse que bajo la hipótesis nula (p, = p, ), las dos poblaciones 
tienen la misma proporción (desconocida) de éxitos, que denotaremos por p. En ese caso tenemos: 


pp) Pp 0-2) 


»—>»,)=N|0, 
(2, 2) n m (10.31) 


y la única cantidad desconocida en la distribución de la estadística p, — p, es el parámetro p. Para obtener 
un estimador de p conviene recordar que las dos muestras contienen información sobre dicho parámetro. El 
estimador ponderado, que toma en cuenta los tamaños de las muestras, es: 


n+m n+m (10.32) 


De acuerdo con lo anterior, una estadística que nos permite probar las hipótesis previamente establecidas es: 


donde 7 está dado por la ecuación (10.32). Bajo la hipótesis nula, la estadística Z¿ tiene una distribución 
que es aproximadamente N(0,1), por lo que que las reglas de decisión para los juegos de hipótesis a), b) y 
c) son las mismas que ya hemos estudiado cuando el parámetro de interés es la media de una distribución 
Normal. Antes de presentar un ejemplo ilustrativo, llamamos la atención del lector sobre el hecho de que el 
estimador ponderado de p es similar al estimador de la varianza común a las dos poblaciones Normales en a 
sección 10.3. 


Ejemplo 10.12. Un investigador quiere comparar los porcentajes de analfabetismo en dos comunidades, una 
rural y una urbana. Su hipótesis es que el porcentaje es mayor en la comunidad rural, y para probarla toma una 
muestra de tamaño 326 en la comunidad rural y otra de {amaño 381 en la urbana, encontrando 62 analfabetos 
en la primera muestra y 39 en la segunda. Con notación obvia los resultados pueden resumirse como sigue: 
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Comunidad rural: n = 326; X = 62 
Comunidad urbana: m = 381; Y = 39 


Si identificamos por p, y p, a las proporciones de analfabetos en las comunidades rural y urbana, respectivamente, 
la hipótesis del investigador, que es del tipo b), puede escribirse: 


Ho: p, S p, en oposición a Ha: p > p, 


Con estos datos: 


== 0.190 

P, n 3265 ` 
a E 9 
A 

- m 381 

a ATY IOI 

p= == =0.143 

n+m 707 
La estadística Z} toma el valor: 
0.190—0.102 0.088 


Zo = -r = —— = 3.38 
(0-143)(0.857) , (0.143)(0.857) 0.026 
326 381 


El valor de Zo es lo suficientemente grande como para rechazar Ho con 4=0.05(2, 05 = 1.645) y con 
a = 0.01 (z901 = 2.33). De hecho, el valor observado de significancia es: 


a = p(Z >3.38) = 0.0004 


por lo que con cualquier œ = 0.0004 se concluye que la incidencia de analfabetismo es mayor en la comunidad 
rural que en la urbana. 6 


En vez de probar hipótesis sobre el parámetro p, — p,, podemos optar por establecer intervalos de confianza 
1% 
para el mismo. Para ese fin nos referimos a la expresión (10.30), donde vemos que puede construirse un intervalo 
de confianza para p, — p, siguiendo el mismo razonamiento que usamos en el caso de la media de una Normal. 
La única diferencia sería que, puesto que se supone que los tamaños de muestra son grandes, podemos usar 
todavía la distribución de Z aunque se reemplacen por sus estimadores muestrales . En efecto, 
que Pry Pa P 1 Y P2 

de (10.30) se sigue que la variable estandarizada: 


(10.33) 


De (10.33) es fácil derivar el resultado que se destaca a continuación. 


A 
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Ejemplo 10.13. Usando los mismos datos del ejemplo anterior construiremos un intervalo de confianza al 95% 
para la diferencia de porcentajes de analfabetismo en las comunidades rural y urbana. El estimador obtenido 
para la proporción de analfabetos en la comunidad rural es: 


P, =0.190 
Mientras que en la comunidad urbana se obtuvo: 
Pp, =0.102 
Con a=0.05 obtenemos, de la Tabla C: 
Zo.025 =1.96 


Por lo que, usando (10.34), los límites del intervalo con nivel de confianza 0.95 para p, — p) son: 


(0.190)(0.810) A (0.102)(0.898) 


L=(0.190—0.102)-1.96 
E=. dió 326 381 


= 0.0357 


(0.190)(0.810) ds (0.102)(0.898) 


L=(0.190—0.102)+1.96 
Wp PELS 326 381 


= 0.1403 


El intervalo de confianza para p, — p», con nivel de confianza 0.95, está dado entonces por (0.0357, 0.1403). ® 


uy. 
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Ejercicios 


10.1. En un programa de alfabetización para adultos se están considerando dos métodos de enseñanza. 
Para comparar sus méritos relativos se toma un grupo de 28 analfabetos, los cuales se separan 
aleatoriamente en dos grupos de 14 cada uno. Cada grupo es alfabetizado con uno de los métodos 
y, una vez completada la instrucción se registra, para cada uno de los 28 individuos, el tiempo (en 
segundos) que tardan en leer un párrafo con una extensión de 125 palabras. Los resultados son: 


Método A: 58, 67, 63, 61, 56, 59, 60, 64, 69, 52, 55, 64, 65, 59. 
Método B: 65, 52, 54, 58, 63, 59, 60, 48, 57, 63, 62, 59, 50, 47. 


a) Pruebe la hipótesis de que la media de velocidad de lectura es la misma con los dos métodos 
a=0.05. 


b) Establezca un intervalo de confianza para la diferencia entre las medias de velocidad de lectura 
a = 0.05 . Relacione el intervalo obtenido con la prueba de hipótesis en a). ¿Cuál método es más 
efectivo? 


c) ¿Qué suposiciones tuvo que hacer para resolver los incisos a) y b)? ¿Parecen razonables con estos 
datos? 


10.2. En un experimento sobre la regeneración de hemoglobina en ratas anémicas se compararon dos 
tratamientos: cloruro férrico (FeCl,) y frijol pinto con hierro. Los resultados se resumen en seguida: 


A A ; 
Ganancia promedio de Pe E 
Desviación estándar 


hemoglobina (gm/100cc) 
FeCl, 25 95 1.30 


Frijol pinto 3 8.9 1.26 


FUENTE: Science, Vol. 90, núm. 2347. 22 de Dic. de 1939. 


Tratamiento Número de ratas 


a) Pruebe la hipótesis de que no existe diferencia entre los tratamientos por lo que toca a la media de 
ganancia de hemoglobina (a = 0.10). 


b) Construya un intervalo con nivel de confianza de 0.90 para la diferencia de medias de los 
tratamientos. 


c) Seau yla media de ganancia de hemoglobina con FeCl 3 y sea 4 yla media de ganancia de hemoglobina 
con frijol pinto. Sea Ò= u y — y, y suponga que se desea probar: 


Ho : Ô = ò en oposición a Ha : ô # ô, 
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¿Para qué valores de 0, se rechazaría Ho con un nivel de significancia 4 = 0.10? 


10.3. Cuando se aplica penicilina a un organismo se observa una elevada tasa de absorción y excreción. 
Para mantener durante mayor tiempo niveles efectivos del antibiótico en el torrente sanguíneo se 
han ideado varios métodos, uno de los cuales consiste en aplicarlo con una dosis de adrenalina, para 
aprovechar las propiedades vasoconstrictoras de este agente. En un experimento (Science, 2 de febrero 
de 1945, pág. 125) se compararon dos tratamientos: 


A: 50 000 unidades de penicilina en 4 cc de solución salina. 
B: 50 000 unidades de penicilina en 4 cc de solución salina + 0.08 cc de adrenalina 1-1000. 


El tratamiento A se aplicó a 5 personas y el B a 6. Los resultados fueron, en unidades Oxford, media 
hora después de la aplicación: 


Tratamiento A: 0.624, 0.312, 0.624, 1.250, 1.250. 
Tratamiento B: 0.156, 0.624, 0.312, 1.250, 0.624, 0.312. 


Construya un intervalo de confianza (4 =0.01) para 44 — Ug. De acuerdo con el intervalo y con 
a = 0.01, ¿hay razón para creer que la concentración de penicilina en la sangre (media hora después 
de la aplicación) se altera por la adición de adrenalina? 


10.4. El contenido de caroteno (pro vitamina A) es importante en un tubérculo comestible. Se ha especulado 
que el color del tubérculo puede ser una guía para seleccionar por contenido de caroteno, lo que sería 
correcto si una alta proporción del total de pigmentos corresponde a caroteno. En un experimento 
(Science, vol. 103, núm. 2668, pág. 193, 15 de febrero de 1946) se obtuvieron los siguientes resultados 
en dos variedades de la planta: 


(Caroteno/ Total de pigmentos) X 100 


Variedad Núm. de muestras 


Media Varianza 
Maryland Golden 42 88.64 8.8872 
Porto Rico 48 81.76 23.5200 
; , Caroteno ; 
Sean UG y lpg las medias poblacionales de =——————X100 en las variedades Maryland 


Total de pigmentos 
Golden y Porto Rico. 


a) Establezca un intervalo de confianza (4 = 0.02) para uç- 


b) Establezca un intervalo de confianza (æ = 0.02) para l y. 


me 
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c) Establezca un intervalo de confianza (% =0.02) para uç — up. 
d) Calcule las anchuras de los intervalos para uç, Up y MG — Mz. ¿Por qué es mayor la anchura del 


intervalo para 4 p que para 4? 


10.5. En determinaciones de los volúmenes endocraneales de homínidos se han obtenido, entre otros, los 
siguientes resultados (Science, mayo de 1970, pág. 967): 


K—_——_—___________RERT€—TP—PmPmP—.— 


ee 


Hi + ido N + di , 
e ia Media Desviación estándar 
Robusto 6 563 53 
Olduvai núm. 7 6 657 65 


a) Pruebe con 4=0.05 que el volumen endocraneal del Olduvai núm. 7 excede en más de 30 cc al 
del Robusto. 


b) Construya un intervalo de confianza al 90% para oy — Up, donde O representa al homínido 
Olduvai y R al Robusto. 


10.6. En 1967 y 1968 se recolectaron muestras para determinar el contenido de oxígeno (en porcentaje) por 
volumen de aire seco. Las determinaciones son (Science, 26 de junio de 1970, pág. 1582): 


1967: 20.9463, 20.9450, 20.9450, 20.9460, 20.9453, 20.9460, 20.9460, 
20.9457, 20.9460, 20.9457, 20.9463, 20.9457, 20.9460, 20.9463, 
20.9463, 20.9463, 20.9463, 20.9437, 20.9457, 20.9463, 20.9457, 
20.9457, 20.9453, 20.9453, 20.9460, 20.9463, 20.9457, 20.9457, 
20.9457, 20.9427, 20.9487, 20.9440, 20.9450, 20.9453, 20.9487, 
20.9493, 20.9457, 20.9450, 20.9480, 20.9450, 20.9473, 20.9467, 
20.9470, 20.9457, 20.9487, 20.9457. 


1968: 20.9460, 20.9457, 20.9457, 20.9463, 20.9457, 20.9453, 20.9457, 
20.9450, 20.9460, 20.9463, 20.9457, 20.9457, 20.9463, 20.9457, 
20.9453, 20.9457, 20.9527, 20.9470, 20.9467, 20.9443, 20.9460, 
20.9453, 20.9400, 20.9480, 20.9413, 20.9460, 20.9427, 20.9470, 
20.9453, 20.9467, 20.9427, 20.9417. 


(En este ejercicio es importante que conserve tantos decimales como le sea posible.) 


a) Construya un intervalo de confianza (4 = 0.001) para la media del contenido de oxígeno en 1967 
menos la media en 1968. 


b) Repita a) con æ = 0.01, a = 0.10 ya = 0.20. 


=E- 
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c) De acuerdo con los resultados en a) y b), ¿concluiría usted que ha habido cambio en el porcentaje 
de oxígeno de 1967 a 1968? 


10.7. En el ejercicio 10.6 las muestras se tomaron en diferentes puntos del mundo en cada año. Sugiera una 
forma de mejorar el diseño experimental. 


10.8. Para estudiar el efecto inhibidor sobre el número de caries de un tratamiento (1% de fosfato dibásico 
de amonio + 0.6% de urea), 53 roedores se alimentaron durante 100 días con una dieta productora de 
caries (30% de harina entera, 30% de leche entera en polvo, 20% de almidón de maíz, 15% de azúcar 
de repostería, 4% de alfalfa y 1% de cloruro de sodio). A 25 de ellos se les añadió el tratamiento en la 
dieta y 28 fueron usados como testigos. Los resultados se presentan en seguida (Fuente: Science, sept. 


8, 1950, pág. 273): 


Núm. de caries 


Tratamient Núm. de animal 
yatamiento úm. de animales Media dais 
Testigo 28 42.0 62.9 
1% amonio + 0.6% urea 25 5.8 12.6 


a) Calcule un intervalo de confianza («æ = 0.05) para la media del tratamiento testigo. 

b) Calcule un intervalo de confianza (A = 0.05) para la media del tratamiento inhibidor de caries. 

c) Calcule las anchuras en a) y b) y compárelas. ¿Por qué son tan distintas? 

d) Calcule un intervalo de confianza («a = 0.05) para la media del testigo menos la media del 


tratamiento inhibidor. ¿Qué suposiciones hubo de hacer para obtener el intervalo? ¿Hay alguna 
que aparentemente no se cumple? ¿Es importante? 


10.9. En el ejercicio 10.8 pruebe, con 4 = 0.01, que el tratamiento inhibidor reduce el número de caries. 
Concluya y comente sobre la confiabilidad de la conclusión. 


10.10. En una investigación antropológica se registra el número de años cumplidos por una mujer al tener 
su primer parto. Separando a las mujeres de acuerdo a si viven en el medio rural o urbano, se 
obtienen las siguientes estadísticas: 


, . : Años cumplidos al primer parto 
Medio Núm. de mujeres 


Media Desviación estándar 
Rural 120 18.3 2a 
Urbano 96 21,2 4.3 
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10.11. 


10.12. 


10.13. 


UN ENFOQUE INTERDISCIPLINARIO 


a) Usando aproximación Normal pruebe la hipótesis de que la edad promedio al primer parto 
es mayor en el medio urbano que en el rural (a=0.01) (no suponga homogeneidad de 
varianzas). 


b) Construya intervalos de confianza (suponiendo distribución Normal) para la media de edad al 
primer parto en el medio urbano (4,,) y en el medio rural (up). Use æ = 0.02. Calcule las 
anchuras de los intervalos. 


En el ejercicio 10.10, ¿parece razonable suponer varianzas iguales para las dos poblaciones? 
a) Calcule un intervalo de confianza (a = 0.01) para 4 — Uy suponiendo varianzas iguales. 
b) Repita el inciso 4) sin suponer varianzas homogéneas e invocando el teorema central del límite. 


c) Calcule las anchuras en a) y b) y compárelas. 


En un experimento para estudiar el efecto de una sustancia (Aloxan) sobre el contenido de glucosa en 
el hígado, se tomaron 6 ratas y se colocaron los hígados, sin mezclar uno con otro, en una solución 
neutra libre de glucosa. Posteriormente, de cada hígado se tomaron dos porciones, y a una de ellas 
se le agregó Aloxan y la otra se usó como testigo. Los resultados fueron (Science, 4 de sept. de 1946, 
pág. 223): 


Glucosa X_mg de peso de tejido seco 
Rata 1 2 3 4 5 6 


Aloxan 0.259 0.204 0.193 0.188 0.156 0.243 
Testigo 0.290 0.148 0.197 0.181 0.172 0.200 


a) Construya un intervalo de confianza para la media de la diferencia en contenido de glucosa. 
a = 0.05. 


b) Pruebe la hipótesis de que el Aloxan reduce el contenido de glucosa. & = 0.025. 


El encargado de una escuela de perfeccionamiento secretarial sostiene que se cometen más 
errores de acentuación en palabras graves que en palabras esdrújulas. Para probar su hipótesis 
elabora dos listas, una con 50 palabras graves y otra con 50 esdrújulas. A cada una de 15 alumnas 
seleccionadas al azar se le dictan las dos listas y se registra el número de errores cometidos. Los 
resultados son: 


10.14. 


10.15. 


10.16. 
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Número de errores 


nn zaz i 
Alumna Palabras graves Palabras esdrújulas 


1 5 3 
2 0 1 
3 3 3 
4 4 3 
5 8 6 
6 9 5 
7 0 1 
8 2 1 
9 3 2 
10 7 4 
11 5 5 
12 6 Ei 
13 2 1 
14 6 1 
15 8 4 


a) Pruebe la hipótesis del encargado (a = 0.01). 

b) ¿Sería mejor seleccionar 30 alumnas, 15 para una lista y 15 para la otra? 

c) ¿Qué debe aleatorizarse en el diseño utilizado? 

Una empresa con un gran número de empleados establece un programa de incentivos para reducir 
los retardos en la hora de entrada al trabajo. Transcurrido un mes de haberse iniciado el programa, 
se toma una muestra de 40 empleados, registrando el número promedio de minutos de retraso por 
día de cada uno de los 40 durante una semana. Para tener una comparación, se toman las tarjetas 


de entrada de los mismos empleados en una semana cualquiera antes de iniciado el programa. Las 
estadísticas para la reducción de los retrasos son: 


D = 4.06, Sp = 3.26 
a) ¿Puede concluirse de los datos que el programa ha disminuido los retrasos? Use & = 0.01. 
b) Construya un intervalo con nivel de confianza 0.99 para la media de disminución de retrasos. 


En el ejercicio 10.14, ¿puede concluirse que la media de disminución de retardos es mayor de 3 
minutos? Use & = 0.025. 


Se desea estudiar la conductividad eléctrica del suelo en un campo experimental. Para ello se toman 
38 muestras de suelo: 19 a (0,30] cm de la superficie y 19 a (30, 60] cm. Los resultados (en mmhos/ 
cm) se presentan en seguida. 
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Muestra 
Profundidad 1 2 3 4 5 6 7 8 9 10 
(0,30] Ta 7.6 8.3 8.2 9.1 7.5 8.0 8.1 8.3 7.4 
(30,60] 11.8 11.6 10.9 117 11.3 8.9 10.6 11.0 11.0 10.3 
Muestra 

Profundidad 11 12 13 14 15 16 17 18 19 

(0,30] 7.9 8.4 7.3 8.0 7.6 7.5 8.1 7.9 8.0 

(30,60] 10.6 11.9 9.9 11.9 10.3 10.1 11.2 11.0 11.2 


a) Construya un intervalo de confianza para la media de conductividad eléctrica en la capa (0, 30] 
cm (4 y ) y también para la capa (30, 60] cm (uy ). En ambos casos use 4 = 0.05 . 


b) Construya intervalos de confianza (a =0.05) para y — Uy bajo las dos siguientes condiciones 
experimentales: 


1) Para tomar las 38 muestras se eligieron 38 puntos al azar en el campo. En 19 de ellos se 
determinó la conductividad en la capa (0,30] y en 19 en la capa (30, 60]. 


2) Para tomar las 38 muestras se eligieron 19 puntos al azar en el campo. En cada punto se 
determinó la conductividad en las capas (0,30] y (30, 60]. Suponga que los 19 puntos son los 


que corresponden a la “muestra” en la tabla. 


c) Calcule las anchuras de los intervalos en el inciso anterior. 


10.17. Refiriéndonos al ejercicio 10.16, considere las dos situaciones experimentales descritas en el inciso 6). 
a) ¿Qué puede ganarse al aparear las observaciones? ¿Qué se pierde? 


b) Sean X;,..., X, las determinaciones en (0,30] y Y;,...,Y, las de la capa (30, 60]. Sea 
D, = Y; =X; . 


1) Verifique que D=Y-X. 
2) Calcule Cov(X,Y) = S yy, y verifique que: S) = SÈ +S} —2S yy. 


> [1 1 
3) Verifique que S5 = 0.1627, mientras que: |S; $ + >) = 0.2070 si se toman las muestras 


P 
como independientes. 19 19 


4) ;A qué se debe que sea menor la desviación estándar del estimador de la diferencia de 
medias cuando se toman éstas como apareadas que cuando se toman como independientes? 
Ésta es la razón de que la anchura del intervalo sea menor en el primer caso. Ver ejercicio 
10.16 c). 
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10.18. En seguida se dan las edades de 28 ganadores de premios Nobel, tanto al realizar su trabajo más 
importante como al recibir el premio (Fuente: Science, Agosto 16 de 1907, pág. 224): 


10.19. 


10.20. 


Nombre Logro u obra Edad al realizarlo Edad al recibir el premio 
Dunant Convención de Génova 36 73 
Sully Prudhomme “Justicia” 39 62 
Mommsen “Historia de Roma” 37 85 
Fischer Síntesis del azúcar 33 50 
Bjórnson “Arne” 26 71 
Mistral “Miréio” 29 74 
Echegaray “O Locura o santidad” 45 zi 
Passy Sociedad francesa de arbitraje 45 79 
Arrhenius Teoría electrolítica 25 44 
Becquerel Rayos de uranio 44 51 
Behring Antitoxina de la difteria 38 47 
Ramsay Helio 43 52 
Finsen Uso de la luz en medicina 34 41 
Cremer Conferencia interparlamentaria 50 65 
Rayleigh Argón 52 62 
P. Curie Radio 39 44 
Róentgen Rayos X 50 56 
Ross Malaria 40 45 
Carducci “Odi barbare” 44 71 
Ramón y Cajal Neurología 41 56 
Moissan Fluoruro 35 44 
Baeyer Índigo 45 70 
Koch Bacilo de la tuberculosis 41 64 
Sienkiewicz “With fire and sword” 38 59 
Lenard Rayos Lenard 32 43 
Suttner “Die Waffen Nieder” 47 63 
Golgi Teñido de nervios 25 58 
Madame Curie Radio 31 36 


Suponiendo que ésta fuera una muestra aleatoria, construya un intervalo de confianza para la media 
de años transcurridos entre la edad al realizar el trabajo y la edad al recibir el premio (a = 0.01). 


Con respecto al ejercicio 10.18, el testamento de Alfred Nobel establece que los premios deben 
otorgarse a personas que hayan contribuido al beneficio de la humanidad “durante el año 
inmediatamente anterior” a aquel en que lo reciben. De acuerdo con los datos, decida si se ha 
cumplido esta disposición del testamento. 


Un psicólogo conduce un experimento para estudiar el efecto del ácido glutámico sobre varias 
características. Su experimento consiste en elegir 50 niños, de entre 10 y 14 años, y formar con 
ellos 25 pares, agrupándolos por cociente de inteligencia y edad. A un miembro de cada par se le 
administra el tratamiento (ácido glutámico) mezclado en 8 onzas de leche entera y al otro miembro 
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10.21. 


10.22. 


10.23. 


10.24, 


10.25. 


del par se le da un placebo (azúcar de maíz, bicarbonato de sodio y sal de mesa), también mezclado en 
leche entera. El experimento se conduce durante 42 días y al final se realizan varias pruebas en cada 
sujeto. Una de las mediciones que se efectúan es el tiempo (en segundos) requerido para completar 
un ejercicio de coordinación. Sean X,..., X35 y Y;,...,Y)5 las mediciones en ácido glutámico y 
placebo, respectivamente, y sea D; = X; — Y, . Pruebe la hipótesis de que el ácido reduce la media del 
tiempo requerido para completar el ejercicio (4 = 0.05). Los resultados son D==—0.7, Sp =2.9. 


Discuta los siguientes aspectos de diseño y técnica experimental en el ejercicio 10.20. 
a) ¿Parecen razonables los criterios de apareamiento? 


b) En el experimento en cuestión los 50 niños eran internos de una escuela. ¿Qué ventajas y 
desventajas tiene esto, comparado con tomar 50 niños que viven en distintos ambientes? 


c) La composición del placebo se ideó para uniformar el sabor de la leche tratada y sin tratar. ¿Es 
importante esto? ¿Por qué? 


d) En lo posible se tomaron precauciones para que ni los niños, ni los empleados de la escuela, ni 
el personal encargado de administrar las pruebas supieran cuáles niños estaban recibiendo el 
ácido glutámico. ¿Con qué objeto? 


En el ejercicio 10.1 se compararon dos métodos de alfabetización, con 14 observaciones en cada 
método. 


a) Grafique por separado cada grupo de datos, mediante diagramas de puntos. ¿Parecen tener 
igual varianza? 


b) Pruebe la hipótesis de igualdad de varianzas en los dos métodos (a = 0.10). 


y 


g5 
Con los datos del ejercicio 10.2 construya un intervalo de confianza al 90% para —* , donde X 
Oy 
identifica al tratamiento FeCl,, y Yal otro. Con & = 0.10, ¿se rechazaría la hipótesis de igualdad de 
varianzas? 


En el ejercicio 10.4 se dan datos del porcentaje de pigmentos que son caroteno, en dos variedades 
z . . . 7 . . 
de un tubérculo. Sean 0% la varianza en la variedad Porto Rico y 0% la varianza en la variedad 
it ul 2 
Maryland Golden. Pruebe la hipótesis 0% > 0%. (a = 0.05). 


En el ejercicio 10.8 se dan las medias y desviaciones estándar del número de caries de 25 animales 

con un tratamiento (4) a base de amonia más urea y de 28 animales con un tratamiento (T) testigo. 
E 

Construya un intervalo de confianza (1— æ = 0.90) para — . ¿Puede suponerse que las varianzas 
T4 


son iguales? 


10.26. 


10.27. 


10.28. 


10.29. 
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En el ejercicio 10.10 se dan las desviaciones estándar (Sp y Sy ) de los años cumplidos al primer 
parto en 120 mujeres en el medio rural y 96 mujeres en el medio urbano. Un investigador sostiene 
que en el medio rural, debido a la mayor uniformidad en las costumbres, la variabilidad en el número 
de años al primer parto es menor que en el medio urbano. Pruebe la hipótesis del investigador con 
a = 0.05, usando los datos del ejercicio 10.10. 


En seguida se presentan los resultados de 10 determinaciones del contenido de paladio en un meteorito 
encontrado en Xiquipilco, México (Fuente: Science, vol. 109, 8 de abril de 1949, pág. 352): 


Contenido de paladio (ppm) 
4.52, 4.18, 4.14, 5.37, 4.59, 4.74, 5.21, 4.85, 4.87, 4.73. 


Los resultados anteriores se obtuvieron mediante un método que utiliza una pila de neutrones. Usando 
un método (supuestamente) mejorado se obtuvieron los siguientes resultados en 12 determinaciones 
en el mismo meteorito: 


4.69, 5.62, 3.74, 3.89, 5.49, 4.73, 4.03, 4.97, 5.01, 4.07, 3.99, 4.68. 


Pruebe la hipótesis de que la variabilidad del nuevo método es menor que la del antiguo 4= 0.05. 


Para estudiar el efecto de una hormona sobre la capacidad de enraizar de una planta que se propaga 
vegetativamente, se plantaron 75 brotes tratados con la hormona y 75 sin tratar. Al cabo de 14 días 
se registró el número de plantas enraizadas en cada grupo. Los resultados se presentan en seguida 


(Fuente: Science, agosto 19 de 1938, pág. 167): 


Plantadas Enraizadas 
Tratadas 75 64 
Sin tratar 19 38 


Pruebe la hipótesis de que la proporción de éxitos es mayor en las plantas tratadas. 4 = 0.01. 
En un estudio para determinar la efectividad de la dramamina contra el mareo, se administró este 


medicamento a 108 individuos entre 25 y 45 minutos antes de abordar un avión. A 108 individuos 
en condiciones similares (ver ejercicio 10.31) se les administró un placebo. Los resultados fueron: 


Tratamiento Núm. de individuos Núm. de mareados 
Dramamina 108 31 
Placebo 108 60 


Pruebe la hipótesis de que la proporción de mareados con dramamina es menor que con el placebo 
œ= 0.01. 


uy 
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10.32. 


UN ENFOQUE INTERDISCIPLINARIO 


Con los datos del ejercicio 10.29 construya un intervalo de confianza para la proporción de mareados 
con el placebo menos la proporción de mareados con dramamina. (4 = 0.02), 


Enseguida se describe la técnica experimental usada para obtener los datos presentados en el ejercicio 
10.29. (Fuente: Science, abril 8 de 1949, pág. 360). 


a) Se hicieron vuelos de una hora simulando condiciones de vuelo turbulento en un aeroplano DC- 
3. Se realizó un total de 12 vuelos, con 18 sujetos en cada uno. 


b) Los 126 individuos fueron voluntarios reclutados en la base aérea Randolph, de Texas, U.S.A. 


c) En cada uno de los doce vuelos, los 18 individuos se subdividieron en dos grupos de nueve. En 
un grupo los nueve recibieron la dramamina y en el otro un placebo de apariencia idéntica a la 
dramamina. Se intentó que los sujetos no supieran si se les administraba la droga o el placebo. 


d) Se controló la distribución de los sujetos en los asientos; así, los que recibieron la droga se 
distribuyeron simétricamente a lo largo y a lo ancho de la cabina. Lo mismo se hizo para los que 
recibieron el placebo. 


e) Todos los vuelos se hicieron a la misma altura sobre el nivel del mar y efectuando las mismas 
maniobras para simular condiciones de vuelo turbulento. 


f) El criterio para determinar si un individuo estaba mareado fue que vomitara. 


¿Puede usted encontrar algún defecto en la técnica experimental? Comente. 


En el ejercicio 10.29 suponga un diseño experimental idéntico (ver también el ejercicio 10.31), 
excepto en que a los 216 individuos se les administró un placebo, pero a 108 se les dijo que se les 
había dado dramamina. Suponga que de este grupo 46 resultaron mareados, mientras que en el otro 
grupo se registraron 61 mareados. Mediante un intervalo de confianza decida si el efecto psicológico 
de creer que se ha recibido el medicamento es significativo. Use æ = 0.05. 
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Análisis de la varianza 


11.1. Introducción 


Quizá sea el Análisis de la Varianza (o Análisis de la Variación) la técnica estadística usada con mayor frecuencia. 
Es posible también que sea la menos comprendida por los usuarios. Las razones que justifican las afirmaciones 
precedentes son múltiples, y aquí solamente expondremos esquemáticamente un par de ellas. Por una parte, la 
técnica mencionada permite probar ciertas hipótesis importantes mediante procedimientos relativamente fáciles 
de memorizar, lo que explica su popularidad. Desde otro punto de vista, es usual que los procedimientos se 
enseñen al estudiante sin conectarlos con las formas alternativas (cuando existen) de probar las mismas hipótesis, 
lo que origina que a menudo no se comprendan las implicaciones de las inferencias obtenidas. Una situación 
muy común es que el estudiante o el usuario de los métodos estadísticos no se percate de la correspondencia 
entre las técnicas del Análisis de la Varianza y otros métodos que ha aprendido previamente. En este capítulo se 
estudiarán las ideas generales y los procedimientos más elementales del Análisis de la Variación, utilizándolo en 
primer lugar como una forma alternativa para probar algunas hipótesis discutidas en los capítulos 8 y 10, y 12 
posteriormente generalizándolo a otras situaciones de interés. En el capítulo se explotarán de nuevo las ideas 
de este capítulo en el contexto del llamado Análisis de Regresión que es la técnica de mayor uso (y abuso) para 
estudiar relaciones entre variables en las ciencias experimentales. 


11.2. Ideas elementales sobre el modelo lineal 


Antes de iniciar nuestro estudio del Análisis de la Varianza es imprescindible retomar la idea de un modelo para un 
fenómeno, idea que ha sido discutida ampliamente a partir del capítulo 6. Allí, y en los capítulos subsiguientes, 
se ha hablado de diferentes funciones de distribución de probabilidades que pueden usarse como modelos para 
situaciones dadas. Las razones esgrimidas para usar modelos probabilísticos se derivan de la idea de que en los 
experimentos que interesan al investigador científico el resultado no puede preverse de antemano, por lo que se 
genera un espacio muestral con los posibles resultados del experimento aleatorio. Sobre el espacio muestral así 
obtenido se define la variable aleatoria cuya función de probabilidades suponemos describe el comportamiento 
del fenómeno bajo estudio. El lector recordará que los parámetros de la función de probabilidades supuesta 
han sido objetos de las técnicas de inferencia que se han estudiado previamente, basándonos en la noción de 
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que un parámetro (como la media o la varianza) resume aspectos relevantes del fenómeno que nos interesa. La 
idea que queremos exponer ahora es una extensión muy simple de las anteriores, y usaremos un ejemplo para 
introducirla. Supóngase que se quiere medir la longitud de una pieza de madera y se hacen diez mediciones 
por diez personas distintas. Aun si las diez personas usan el mismo instrumento de medición, lo más seguro 
es que haya variación entre las diez lecturas obtenidas. La precisión de una lectura dependerá de lo cuidadoso 
que sea un lector, de sus capacidades visuales, etc. Si consideramos a la longitud que quiere medirse como 
una constante desconocida (haciendo caso omiso de que puede variar con la temperatura o la humedad), el 
objetivo del experimento es concluir sobre la magnitud de un parámetro, y podemos pensar en las lecturas, 
que denotaremos por Y,, Y,,..., Y y, como en observaciones de variables aleatorias. Si además las observaciones 
son independientes tenemos, antes de realizar las lecturas, una muestra aleatoria Y,,..., Y que puede usarse 
para inferir sobre el parámetro. Ahora bien, las lecturas pueden coincidir con el valor de la longitud o discrepar 
de él en virtud de los errores de medición cometidos por los individuos. Sean €, £,,..., €,p los errores de 
medición. Entonces cada variable aleatoria Y, (ż = 1,...,10) puede representarse como la suma de dos cantidades: 
la longitud que deseamos medir, que identificaremos por la letra 4, y el error de medición correspondiente. Es 
decir, que las variables aleatorias Y,,..., Y y admiten la representación: 


Y, =14+e8;i=1,2,....10 (11.1) 


En la ecuación (11.1) hay varios aspectos que es necesario considerar. En primer lugar es claro que debe suponerse 
que las €; pueden tomar tanto valores positivos como negativos, puesto que suponer sólo valores positivos (o 
negativos) equivaldría a suponer que todos los sujetos obtienen lecturas mayores (o menores) que la verdadera. 
Es evidente, además, que las £; deben ser variables aleatorias, puesto que las Y, lo son, mientras que 4 es una 
constante. Cualquier tipo de inferencia estadística que quiera hacerse sobre 4 dependerá entonces del modelo 
probabilístico que se suponga para las variables £,,...,€,y. Adelantaremos que el modelo más comúnmente 
adoptado es el Normal con media cero y varianza 0”, de conformidad con la Ley Normal de los Errores, de la 
cual se habló en el capítulo 6. En este caso, y en muchos otros, la distribución Normal es un modelo plausible 
por muchas razones, entre otras la simetría alrededor de cero de la distribución de frecuencias de los errores. 


El ejemplo de la medición de la longitud de una pieza de madera nos ha servido para proponer el modelo 
Y, = u+€;, en el cual se supone una distribución (frecuentemente la Normal) con media cero para los 
errores. El lector puede haberse percatado ya de que esta es simplemente una reformulación de las situaciones 
presentadas en los capítulos 8 y 9, particularmente en los casos allí examinados donde se supuso una distribución 
Normal para los elementos de la muestra. En efecto, puesto que 4 es un parámetro, si se supone que Ele,)=0 
y Var(e,)=07, se sigue de (11.1) que: 
E(Y,)= E(u+e,)=u+Ele,)= u 
Var(Y,) =Var(u+e,)=Var(e, =p? 


y, además, si el modelo para las £; es Normal se tiene, de resultados anteriores, que: 


Y, -Nl(uo?);i=1,2,....1 


donde z es el número de variables aleatorias. De manera que inferir sobre 4 (la longitud de la pieza de madera 


en el ejemplo) equivale a inferir sobre la media de un modelo N ( 1,0?) usando una muestra aleatoria de la 
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población correspondiente. La idea de que ésta es meramente una nueva presentación de conceptos ya discutidos 
previamente se refuerza si notamos que las variables aleatorias €; son tales que sus valores en las diferentes 
repeticiones del experimento no pueden registrarse, de modo que /as e, son variables aleatorias no observables 
en virtud de que el valor de u es desconocido y, en consecuencia, la base para la inferencia siguen siendo las 
variables Y, 


Las reflexiones anteriores se han hecho con objeto de evidenciar que el modelo que ahora se propone tiene una 
total correspondencia con los casos discutidos en los capítulos 8 y 9. Al hablar de €; en vez de Y, simplemente 
estamos haciendo un cambio en el parámetro de localización, mediante una translación en el eje de las abscisas, 
aspecto que ya se discutió al hablar de la distribución Normal en el capítulo 6. De lo anterior no debe concluirse, 
sin embargo, que el modelo que recién empezamos a estudiar nos remite invariablemente a casos conocidos. 
El hecho es que, si extendemos las ideas de esta sección, podremos analizar situaciones de mayor complejidad 
que las que ya se han estudiado. El concepto importante en el modelo Y, = U +€; reside en la representación de la 
variable observable Y, como la suma de un parámetro (u) y una variable aleatoria no observable (e; ), dando origen 
a una ecuación que pretende explicar el comportamiento de la variable aleatoria Y, Tanto el modelo Y, =Uu+e, 
como los que se estudiarán en las secciones 11.4 y 11.5, y el modelo de regresión lineal simple que ocupará 
todo el capítulo 12, son casos particulares de lo que en la metodología estadística se llama el Modelo Lineal 
Generalizado. A reserva de profundizar sobre esto en el capítulo 12, sólo añadiremos que la palabra lineal en 
el nombre del modelo se refiere a que las ecuaciones que caracterizan a la variable aleatoria observable son 
lineales en el (los) parámetro(s). En la siguiente sección utilizamos el ejemplo más simple de modelo lineal 
para introducir la técnica de Análisis de la Varianza, y en el resto del capítulo exploraremos generalizaciones de 
dicha técnica, las que capacitarán al lector para comparar dos o más tratamientos bajo los tipos de aleatorización 
restringida y no restringida discutidos en el capítulo 10. 


11.3. Análisis de la varianza en el modelo Y; = u +€; 


Como su nombre lo sugiere, el análisis de la varianza descansa fundamentalmente en el estudio de la variabilidad 
de las observaciones. Para mostrar el método y la lógica en que se sustenta, nos referiremos al modelo lineal más 
simple: Y; = 4+€,. En este modelo es claro que: 


e, =Y, —3i=1,2,....1 (11.2) 


Es decir, que un error es la diferencia entre una observación y el valor verdadero del parámetro. En seguida 
partimos ese error en dos componentes mediante la igualdad trivial: 


Y, —u=( ¡Y )+ (Y —u) (11.3) 


La igualdad (11.3), a pesar de su sencillez, es de extraordinaria importancia en nuestro desarrollo. Una forma 
de interpretarla sería diciendo que un error está compuesto por la desviación de una observación con respecto a 
la media muestral, sumada con la distancia entre la media muestral y la media poblacional. De (11.3) se sigue 
además que: 


(Y, -uY =[(%, -Y)+(Y -u)] (11.4) 
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Puesto que (11.4) es cierta para todas y cada una de las observaciones Y, (¿ =1,2,..., 12), podemos escribir: 


n 


(Y '= Sir- P)+(7—1)] 


i=] (11.5) 


y mediante la aplicación de reglas ya conocidas obtenemos, partiendo de (11.5): 


i=] i=l i=l 
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Este último resultado requiere atención especial y se anota en seguida para referencia posterior. 


Èt,- -u =$ (Y,-FY +n -uY 


ai (11.6) 


Si observamos (11.3) y (11.6), notamos que la partición del error €; en dos componentes nos ha llevado a una 
expresión similar que involucra sumas de cuadrados de las desviaciones originalmente consideradas en (11.3). 
Por esta razón a las tres componentes de la ecuación (11.6) se les llama Sumas de cuadrados. Bajo la suposición 


2 . . . . . 
de que Y;,...,Y, es una muestra aleatoria de N N(uo?), dichas sumas de cuadrados tienen distribuciones 


n 


probabiles muy sencillas de derivar, y pueden usarse para generar un procedimiento para probar hipótesis 
sobre u. Con objeto de derivar las distribuciones de las sumas de cuadrados dividimos todos los términos en 


(11.6) por o”, obteniendo: 


n (Y — 2 n Yy 2 T 2 
( i 4) -5 1 > ) „20 u) 
ES a Y i (11.7) 


De (11.7) es fácil obtener las distribuciones correspondientes. En efecto, puesto que cada Y, ~ N (uo? ), es 
claro que: 


HA NOD) 


de donde: 
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K 2 
— a MAN 


Además, puesto que las Y; son independientes, y usando la propiedad la de la distribución Ji-cuadrada, se obtiene: 


TE (11.8) 


El segundo resultado se obtiene todavía con mayor facilidad. Dadas nuestras suposiciones, la distribución de la 
media muestral es N ( u,g? / n) y, por tanto, la media estandarizada tiene distribución Normal estándar. Esto es: 


Vn(Y — u) 


~ N (0,1). 


Y, por ello: 


o j (11.9) 


Por lo que toca a la distribución de la suma de cuadrados restante, el lector puede haber notado ya que es una 
antigua conocida. Si con la notación usual identificamos a la varianza muestral por S? tenemos que: 


n (Y-F _ (DS 


2 2 , 
2 2 


¡a Y a 


y sabemos, del capítulo 7, que su distribución es May Es decir, que: 


(M-FT a 
A e 
i=] O 


(11.10) 


Las ecuaciones anteriores nos permiten justificar informalmente el resultado presentado en el capítulo 7 sobre la 
distribución de (n—1)5?* / 0°. Este resultado es sugerido fuertemente por la ecuación (11.11), haciendo uso de 
la propiedad aditiva de la distribución Ji-cuadrada. Reescribiendo (11.7) y añadiendo los resultados obtenidos 
posteriormente tenemos el siguiente esquema: 


2 2 ii 2 
¡=1 10] j=] (6 o 
AAA 
2 2 
Xin) = yen č T NÖ 
A = B + ee 


(11.11) 
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Una vez obtenidas las distribuciones de A, B y Cen la ecuación (11.11), explicamos cómo pueden usarse para 
probar hipótesis sobre 4. En primer lugar, asentamos que la partición de la variabilidad que hemos hecho sólo 
nos permite probar hipótesis de dos colas sobre u. Es decir, que en lo sucesivo nos referiremos al juego de 
hipótesis: 


Ho: u= Uy en oposición a Ha: U Æ lo 


donde 41, es el valor supuesto del parámetro desconocido. Que no sea posible probar hipótesis de una cola 
con esta técnica es una consecuencia de haber tomado los cuadrados de las desviaciones, y sobre esto se 
dirá algo más posteriormente. Para derivar una estadística para probar hipótesis sobre M es natural recurrir 
a la componente C en (11.11), puesto que la variable aleatoria C involucra no sólo a Y y au, sino además 
a la distancia Y — u . Sin embargo, n(Y — uy lo” no es una estadística, dado que tanto 4 como 0” son 
parámetros desconocidos. Por lo que toca a u el problema está resuelto, ya que u debe tomar el valor 4o para 
fijar el nivel de significancia. Con objeto de que la estadística no dependa de 0” usaremos la componente B 
en (11.11). Dado que B y C son ambas variables aleatorias Ji-cuadrada (además son independientes, hecho 
que asentamos sin probarlo) tenemos que: 


AT —uy 10*(1) a-uy 1 
D(x, -FY 1001) úl 


i=] 


de acuerdo con la definición de la distribución F (definición 6.11). De aquí deducimos que, si la hipótesis nula 
4 = Uy es cierta, la estadística: 


y podemos usar F) para probar el juego de hipótesis propries; La regla de decisión que nos garantiza una 
prueba con nivel de significancia æ es: Rechazar Ho si F, > F}, „. En realidad, y tal como lo hemos señalado 
varias veces, en este caso particular la técnica de Análisis de la alas (que se abreviará A de Ven lo sucesivo) 
no nos ha enseñado nada nuevo, según se explica en seguida. En el capítulo 8 aprendimos que para probar 
Ho: u = Uy oposición a Ha: U%X lọ, la prueba usa la estadística: 


Va (Y — uo) 
$ 


rechazándose Ho si t) 2 ta (n—1) o si ty S —ta (7—1). Ahora hemos concluido que también puede usarse 
la estadística: 
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con la regla de decisión: Rechazar Ho si F, 2 F! | a. Una inspección cuidadosa de tọ y F) nos muestra que 
están relacionados por la ecuación % = té y, puesto que sabemos por la ecuación (6.27) que el cuadrado de 
una variable + con v grados de libertad tiene distribución F}, concluimos que se trata de la misma prueba. En 
el caso del procedimiento basado en la distribución de F, la regla de decisión nos obliga a tomar una región 
de rechazo que es un intervalo en la cola derecha de la distribución de F, no obstante que la prueba es de dos 
colas. La razón, muy sencilla de entender, es que la estadística F} depende de los cuadrados de las desviaciones, 
de manera que tanto una distancia negativa como una positiva de Y con respecto a 4 se reflejan en valores 
positivos de F, y van en contra de Ho. Esto mismo explica que no puedan probarse —mediante F— hipótesis 
de una cola, ya que F) no distingue entre valores positivos y negativos de Y — uo. 


Ahora bien, la correspondencia entre las distribuciones ż y F existe únicamente para el caso en que la 
variable aleatoria F tiene un grado de libertad en el numerador. Si en la partición que se muestra en la 
ecuación (11.11) la componente C tuviese dos o más grados de libertad, la distribución de F resultante no 
tendría correspondencia con la distribución 1, y es por ello que la técnica de A de V es importante. Para 
comparar las medias de 3 o más poblaciones dependeremos completamente de la distribución de Fa través 
del A de V, ya que la prueba de £ nos limita a probar hipótesis sobre una media poblacional, o a comparar 


dos de ellas. 


Una vez que hemos dado un avance de lo que vendrá después, retrocedemos un poco para reunir los resultados 
obtenidos en esta sección. Todo el procedimiento para probar Ho: u= uo en oposición a Ha: UF Uy 
mediante la distribución de F se resume usualmente en una tabla conocida como Tabla de Análisis de la 
Varianza. Con objeto de tener a la mano la información necesaria, reproducimos la parte pertinente de la 
ecuación (11.11), que muestra la partición de la variabilidad de las observaciones. 


> 2 
X(n) m X(n—1) mE Xa) 


En la tabla de A de V (Tabla 11.1), los tres componentes en la ecuación anterior aparecen sin el divisor o’. 
Esto es porque la estadística Fo, al ser la razón de dos de ellas, no depende de o”. Además, puesto que la 
hipótesis nula es Ho: 4 = y, el valor de u es sustituido por 4o. Como se dijo antes, los numeradores de 


los términos en (11.11) se llaman Sumas de Cuadrados. Así, a LE = Ho y se le llama Suma de Cuadrados 
Total, a SE pS yy se le llama Suna de Cuadrados del Error, y a n(Y — Mo y se le llama Suma de Cuadrados 


debida a la Media. En lo sucesivo las identificaremos por las abreviaturas S. C. TOTAL, S. C. ERROR y 
5.10. 


Ahora pasamos a explicar con mayor detalle la Tabla 11.1. En la primera hilera el encabezado Fuentes 
de Variación (F. V.) meramente destaca que el A de V se basa en una partición de la variabilidad de las 
observaciones en diferentes fuentes (o factores) de variación. En la segunda columna el nombre Grados 
de Libertad (G. L.) alude a los parámetros de las distribuciones Ji-cuadrada asociadas con las Sumas de 
Cuadrados (S. C.) en la tercera columna. La siguiente columna muestra los Cuadrados Medios (C. M.) que 
se obtienen dividiendo cada suma de cuadrados por sus grados de libertad, y sólo son un paso intermedio para 
obtener la estadística F) en la última columna. > 


/ 


N 
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Tabla 11.1. Tabla de Análisis de la Varianza para el modelo Y, = u +€,. Ho: u= uo en oposición a Ha: UA Uy 


Fuentes de Grados de Sumas de Cuadrados F 
Variación (EV) Libertad (G.L) Cuadrados (S.C) Medios (C.M) A 
5 2 Y —u) Fm) 
Media (u) 1 n(Y E y) e. AE 
3 > aury 


Error n—1 X(x, -Fy SS 


Total n D -= Mo y 


Como se discutió antes, la estadística F}, bajo la hipótesis nula, tiene una distribución Æ}, y por tanto la 
pa s y 1 
regla de decisión consiste en rechazar Ho si F) > F,_; ¿¿, de manera que una vez llenadas todas las celdas de la 


7 
Tabla 11.1 lo único que resta es obtener Ps y, si FA, > a la decisión es rechazar Ho con un nivel de 
significancia æ. Presentaciones similares a la de la Tabla 11.1 son inmensamente populares entre los usuarios de 
los métodos estadísticos, sobre todo en situaciones más complicadas, y la razón es que la tabla recién exhibida 
puede extenderse con facilidad a dichas situaciones. Antes de mostrar en las secciones 11.4 y 11.5 cómo se 
generaliza el método del A de V, simplificamos la Tabla 11.1 para que coincida con la forma en que se muestra 


usualmente en los textos elementales. 


La Tabla 11.1 se desarrolló con objeto de probar el juego de hipótesis Ho: u = Mo en oposición a Ha: UA Up. 
Más frecuentemente la tabla de A de V se formula como si el propósito fuera probar Ho : 4=0 en oposición a 
Ha : u A 0. Esta presentación, que aparentemente es más restringida que la anterior, en realidad no lo es puesto 
que si tenemos observaciones Y;,...,Y,,, que se supone son una muestra aleatoria de NV ( uo”), y queremos 
probar la hipótesis nula Ho: 4 = Uy, siempre podemos definir variables aleatorias X, = Y, — ug, las cuales, 
cuando la hipótesis nula es cierta, tienen distribución N (0,0?) por lo que las variables X, = Y, — My pueden 
usarse para probar Ho: u= 0, obteniéndose una prueba equivalente a la anterior. Con las nuevas variables 
centradas en cero, la tabla de A de Ves como la que se presenta en la Tabla 11.2. 


Es evidente que la Tabla 11.2 es una simplificación trivial de la Tabla 11.1, sólo que ahora 44, =0. Antes de 
presentar un ejemplo destacaremos algunos aspectos de la Tabla 11.2, ya que son estos aspectos los que explican 
por qué esta segunda presentación es la más favorecida por otros autores. En primer lugar, si observamos las S.C. 
notamos que la partición es sencillísima, ya que S.C. (u) + S.C. ERROR = S.C. TOTAL dado que, como ya 
nos es familiar: 


En segundo lugar haremos un comentario sobre los nombres de las fuentes de variación. La primera de ellas ha 
g g p 
sido identificada como “debida a la media (u)”. En la Tabla 11.1 no es muy clara la razón para este nombre, 


pero en la Tabla 11.2 es evidente, puesto que si Ho es cierta, debemos esperar valores de X cercanos a cero, 


de modo que si S.C.(4) es grande, esto se debe a que u difiere del valor supuesto por una distancia grande. 
Razonando similarmente se justifican los nombres S.C. ERROR y S.C. TOTAL. 
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Tabla 11.2. Tabla de Análisis de la Varianza para el juego de hipótesis Ho: 4 =0 en oposición a Ha: u #0 


EV G.L SG C.M Fy 
cu =$ nx? 
Media (u) 1 nX* nX* : 
n eee n (X e 2 5 
Error n—1 S (x, -X) > — =$? 
i=l i=] 
Total n DANS 


Ejemplo 11.1. Con objeto de ilustrar el procedimiento del A de V presentamos un ejemplo sin mayor, interés 
práctico. Se tiene una muestra aleatoria de tamaño 15, que se supone es de una población NI, o°). Las 
observaciones en la muestra son: 


Y: 68, 69, 78, 86, 73, 69, 80, 67, 59, 68, 70, 66, 69, 72, 77 


Se desea probar la hipótesis Ho : u = 68 en oposición a Ha: u #68 mediante una tabla de A de V. Podemos 
hacerlo con la Tabla 11.1 o la 11.2. Por ser más usual la segunda de ellas, es la que se usará de aquí en adelante. 
Para ello es necesario restar 68 de cada observación, obteniendo: 


250,1, 10, 18,5, 1, 12, —1,-9,0,2, =2, 1,4, 9 


La hipótesis equivalente con estos datos es Ho : 4 = 0 en oposición a Ha : u #0. Es fácil verificar que con los 
datos transformados: 


X =3.4, Y X? =783, nX* =(15)6.4)) =173.4 


j=] 
Por tanto, la S.C. ERROR es: 


S.C. ERROR = Y (X, -X = S X2 -n 
i=l i=l 


= 783 — 173.4 = 609.6 


Con estos datos llenamos la tabla A de V. 


EV. G.L. SG C.M. Fs 
Media (1) 1 173.4 173.40 3.98 
Error 14 609.6 43.54 


Total 15 783.0 
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Para probar la hipótesis de que la media de la población muestreada es 68, con 4 =0.05, obtenemos de la 
tabla correspondiente F% 0.95 = 4.60 y, puesto que =, < 4.60, la conclusión es que no se rechaza Ho en el 
juego de hipótesis Ho: u =68 en oposición a Ha: u #68. El lector debe notar que si se a con las 
observaciones originales se obtiene el mismo valor de F}, ya que entonces la media aritmética es Y = 71.4, 
por lo que S.C. (u) es: 


n(Y — u} =15714-68) =173.4 


y la S.C. ERROR también es la misma. 


Para finalizar el ejemplo probamos la misma hipótesis mediante una prueba de ż. Usando los datos originales 
se encuentra: 


Y =71.4, S =6.5987 


por lo que la estadística % toma el valor: 


J15 (Y - 68.0) 
y= pe ll 1.996 
6.5987 


De la tabla de ż obtenemos los valores críticos 


to.025(14)=2.145 y —t0025(14) =-2.145 


Puesto que £, no está en la región de rechazo, la conclusión es la misma que con la prueba de F. Además, debe 
señalarse que salvo pequeños errores de redondeo: 


2 Ll 
t0.025(14)= F 40.05 + 


Antes de terminar esta sección queremos referirnos a un aspecto que a menudo se omite en los textos elementales. 
En la Tabla 11.2 (o en la 11.1) es de gran importancia adicionar una columna extra, en la cual se exhiben las 
esperanzas matemáticas de los cuadrados medios que intervienen en el análisis. Estas esperanzas típicamente 
dependen de parámetros desconocidos y no pueden evaluarse numéricamente, pero son importantes porque 
en este modelo, y sobre todo en otros más complicados, dichas esperanzas son una guía invaluable para decidir 
qué hipótesis pueden probarse usando razones de cuadrados medios. En el modelo Y, = u +€;; (i =1,...,7) su 


determinación es sencilla. Empezaremos por nY”. Puesto que sabemos que, suponiendo un modelo Normal, 
Y ~ N (u, g“ 21), se tiene que: 


Var[Y)=E(92)-[E (PY =0? /n 


Capítulo 11 
ANÁLISIS DE LA VARIANZA 


de donde: 
ElP?)=0* In+p? 
y, por tanto: 
ElnY?)=0? +np? (11.12) 
En cuanto a la esperanza del cuadrado medio del error, es un resultado conocido que: 
Els?) =0? (11.13) 


Usando (11.12) y (11.13) presentamos la Tabla 11.2 con la columna adicional Esperanzas de Cuadrados Medios 
(E.C.M.). 


Tabla 11.3. Tabla A de V del modelo Y, =u+e; mostrando las esperanzas de cuadrados medios. Ho:u=0 en 
oposición a Ha: u #0 


EV G.L SC C.M F E.C.M. 
m ” y+ 

Media (u) 1 ny? nY? ET o? +nu? 
n " 2,52 

Error 1 S Y? ar? 2, nY = y a? 
i=l n—1 

Total n Sr 

=] 


La Tabla 11.3 nos permite comprender más profundamente la lógica de la prueba de F en el A de V. En primer 
lugar es claro que 


E(C.M.(u))=0? +nu? > E(C.M. ERROR) = 0° 


Qué tanto es mayor depende de dos factores: por un lado, del valor verdadero de 4, y por otro, de n, el 
tamaño de la muestra. Nótese que para cualquier n, y a menos que 4=0, el valor esperado del numerador 
de F, es mayor que del denominador, y de aquí que la cola adecuada para el rechazo de Ho sea la derecha. 
Pero además E (C.M.( u)) nos recuerda dos ideas discutidas previamente. La primera tiene que ver con la 
distancia entre el valor supuesto (u) del parámetro en Ho y el valor verdadero (u). Puesto que en este caso 
u =0, cualquier valor (positivo o negativo) de 4 aumenta la E.C.M. del numerador de F}, y también esta 
E.C.M. aumenta cuando se incrementa el tamaño de la muestra. En los dos casos el efecto es que el valor 
esperado de F) es grande y, mientras más grande sea, la probabilidad de rechazar hipótesis falsas aumenta, 
es decir que se tienen pruebas con mayor potencia (menor probabilidad de Error Tipo II) para un nivel de 


significancia dado. 


Meropos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


11.4. Análisis de la varianza en el diseño completamente aleatorizado 


En este apartado presentamos una extensión del modelo lineal simple que se examinó en la sección 11.3. 
La importancia práctica del nuevo modelo reside en que nos permite comparar las medias de los modelos 
probabilísticos de varias poblaciones bajo las condiciones de aleatorización irrestricta discutidas al inicio de la 
sección 10.2. En esa sección consideramos (aunque sin llegar hasta el análisis) el caso en que se quieren comparar 
t tratamientos y se dispone de 7, unidades experimentales para el primero de ellos, n, para el segundo...., 2, 
para el último. Los tratamientos se asignarán cuidando que cada una de las unidades disponibles tenga la misma 
probabilidad de recibir un tratamiento dado. Esto se consigue sencillamente extendiendo el proceso descrito 
para £=2 en la sección 10.2; es decir que, si por ejemplo se van a comparar 4 tratamientos, digamos A, B, Cy 
D, usando 3 unidades para el tratamiento A, 2 para B, 4 para C y 3 para D, el primer paso consiste en numerar 
las 12 unidades experimentales y colocar fichas idénticas numeradas del 1 al 12 en una urna. En otra urna se 
depositan 3 fichas con la letra A, 2 con B, 4 con C y 3 con D. Finalmente, mediante la extracción sucesiva de 
12 pares de fichas (una de cada urna en un par cualquiera), se decide qué unidades experimentales llevarán qué 
tratamientos. Obviamente, las extracciones son sin reemplazo. 


En el experimento descrito se tiene ż = 4, n =3,m, =2,m3=4 y n4 =3. A las cantidades 74,7% ,...,7, se les 
llama las repeticiones de cada tratamiento. Así, en el ejemplo, decimos que existen dos repeticiones del tratamiento B. 


Cuando nos ocupamos del caso £=2, usamos una literal distinta para identificar las respuestas de cada 
uno de los tratamientos (X y Y concretamente). Con un número arbitrario de tratamientos es más práctico 
introducir una notación con dos subíndices. Cada respuesta en una unidad experimental dada se representará 
genéricamente por Y, donde el valor que toma el subíndice ¿ nos dice a qué tratamiento nos referimos, y 
el valor del subíndice j cuál de las repeticiones de ese tratamiento es la representada. El subíndice i puede 
tomar cualquier valor entero entre 1 y £, mientras que los valores de j dependen del valor de ¿. Por ejemplo, 
si ¿=1, j puede tomar cualquier valor entero entre 1 y »2,. Lo anterior puede resumirse diciendo que las 


respuestas se representan por Y;; ¡=1,2,..., 2; 1=1,2,...,f. 


Enseguida se presenta (con la nueva notación) la estructura de los datos para el tipo de experimento que nos ocupa. 


Tabla 11.4. Estructura de datos para un experimento con aleatorización irrestricta. 


Tratamientos 


Totales de tratamientos 


Medias de tratamientos 
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En la Tabla 11.4 se ha aprovechado el despliegue de la información para introducir más notación nueva, la 


que es casi obvia. En primer lugar, los totales de tratamiento se han representado por Y, Y,.,...,Y,. para los 
tratamientos 1, 2,..., £. Formalmente: 


n; 
Y. = X Yp i=l, st 
j=1 


(11.14) 
Además, Y.. representa la suma de todas las observaciones. O sea que: 
n= 2,2 Xi 
id (11.15) 


y también: 


Como es fácil ver, la notación adoptada consiste en sustituir un índice por un punto una vez que se ha sumado 
sobre ese índice. Además, las medias de tratamientos se han representado por: 


Y A; Y, 
Y, ==>2;¡=1,2,...,4 
ki -i (11.16) 


Finalmente, la media general del experimento es: 


t 
2 n; 
¡=1 


= Y. 
$ 


(11.17) 


Antes de presentar un ejemplo que auxilie al lector en la comprensión de las definiciones anteriores, hacemos 
hincapié en que el método de análisis para el diseño se fundamenta en el tipo de aleatorización utilizado. Esta 
idea se refuerza a través del nombre que se da al diseño, al cual se le llama Diseño completamente Aleatorizado (o 
Diseño Completamente al Azar). En lo sucesivo usaremos la abreviatura DCA para referirnos a él. 


Ejemplo 11.2. En un experimento se van a comparar los porcentajes de carbohidratos en 4 marcas de pan, para 
lo cual se van a hacer 18 determinaciones: 5 en la primera marca, 3 en la segunda, 4 en la tercera y 6 en la cuarta. 
En este caso cada marca es un tratamiento (1 = 4), y se tienen 2, = 5, 1, = 3, n} = 4, y n4 = 6. Para obtener 
las respuestas se tomarán muestras de los tamaños especificados de cada marca y se harán determinaciones de los 
porcentajes mediante un procedimiento (hasta donde sea posible) idéntico en las 18 unidades experimentales. 
El lector debe tomar nota de que este experimento no encaja a la perfección en el esquema de aleatorización 
prescrito para el DCA. La razón es que en este caso no estamos en libertad de asignar las unidades experimentales 
a los tratamientos, ya que las poblaciones (las 4 marcas) existen independientemente de la acción de la acción del 
experimentador. No obstante lo anterior, basta que las muestras aleatorias de las 4 poblaciones sean independientes 
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para que el análisis bajo el modelo que se propondrá sea válido. Tal como se dijo en la sección 10.1, aquí tenemos 
un diseño de muestreo en vez de un diseño experimental, y el ejemplo se eligió deliberadamente para destacar que 
las técnicas de esta sección son también aplicables en situaciones como la que estamos describiendo. 


En la siguiente tabla se presentan los resultados de las 18 determinaciones de carbohidratos. Posteriormente, y 
una vez que se haya descrito el método de análisis, volveremos sobre estos datos. Por lo pronto el lector debe 
usarlos para verificar que ha comprendido las ecuaciones (11.14) a (11.17). 


Tratamiento (marca) 


SSi S 


Una vez explicada la aleatorización y la estructura de los datos para el diseño, el siguiente paso es describir y 
explicar el modelo lineal y las suposiciones distribucionales para el análisis. El modelo se deduce fácilmente si 
consideramos que se tienen £ muestras aleatorias independientes de tamaños 7}, 2),..., 2, , respectivamente. La 
suposición básica es que: 


2 
Yi Y 2»... Yi, es una muestra aleatoria de N (u0 ) 


m 
: 2 
Yri» Yo25- Y, es una muestra aleatoria de N (u,,0 ) 


es una muestra aleatoria de M (u, ¡a ) 


Bajo estas condiciones, y considerando una muestra por separado, las observaciones en ella pueden representarse 
por el modelo lineal simple Y, = u +e;; ¡=1,..., n;. Sin embargo, con objeto de incorporar a los elementos de 
todas las muestras en una sola ecuación, introducimos también la notación con dos subíndices para la variable 
aleatoria no observable (e) en el modelo lineal, es decir, que denotaremos por €, y j= hasni = lyx st) 
al error en la j-ésima repetición del ż-ésimo tratamiento, Con la misma atgumentación de la. sección 11.3 se 
propone el modelo: 


Y= w +85 j=l nmi E Lln 
yT TEI did (11.18) 


para las respuestas de un DCA. Más aún, por la suposición de independencia entre y dentro de las muestras, y 
adoptando un modelo probabilístico Normal, se tiene que las £; son independientes, todas con distribución 
Normal con media cero y varianza 0”, Esto lo escribiremos: 
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-=NIl0,0?); ¡=1,....n,; i=1,..., 
e, ~ NIl0,0*); j pa e (11.19) 


El modelo (11.18) puede escribirse de otra manera atendiendo a la forma en que se realiza un diseño experimental. 
Para ello consideramos que la capacidad promedio de respuesta de todas las unidades experimentales es la misma 
(11) antes de aplicar los tratamientos, y que si todas se observaran en condiciones lo más similares posible, las 
respuestas serían las variables aleatorias Y, = u +€;,. Se sigue que al aplicar el tratamiento ¿-ésimo a un grupo 
(de tamaño n,) de ellas se introduce un de (T,) de ese tratamiento en las variables por observar. El modelo 
puede entonces escribirse: 


Y. = utt; tEn ¡=1,...,M;51=1,...,t 
ij u $ ij J ¡3 4 (11.20) 


donde, como antes: 


Ey = NI (0,0?) 


Claramente (11.18) sólo es otra forma de escribir (11.20), si hacemos 4; = 4 +7,(¡=1,...,1). La ventaja de 
la expresión (11.20) estriba en que nos recuerda que en el DCA una suposición clave es la homogeneidad del 
material experimental. 


En lo sucesivo usaremos la segunda forma del modelo (ecuación (11.20)). En los textos que manejan las dos 
presentaciones, al modelo (11.18) se le llama un Modelo Reparametrizado, haciendo alusión a que es una 
representación abreviada (mediante la suma de dos parámetros) del modelo en (11.20). La importancia de los 
modelos reparametrizados, y de la técnica que los produce —llamada Reparametrización—, es muy grande para 
efectos de estimación en un modelo lineal, pero su discusión excede los alcances de este texto. 
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El modelo implica que mientras que las medias de las + poblaciones que se van a comparar son posiblemente 
distintas, el hecho de que todas las £,, tengan una varianza común equivale a suponer que las + poblaciones 


tienen la misma varianza. Desde el punto de vista del modelo Y; = u+T, +E; esto quiere decir que se empieza 
con unidades experimentales con la misma capacidad de respuesta (u) y con la misma varianza (02). La 
aplicación de los tratamientos tiene el efecto de alterar las medias, que ahora son 4, =4+T p Pero se supone 
que no se modifican las varianzas. Esta suposición es, después de la de independencia de las Ej» que es capital, la 
más importante, ya que el procedimiento de análisis que se usa no es robusto, en lo más mínimo, a la violación de esta 
suposición. Desafortunadamente en muchos casos, cuando la media crece (t; >0), la varianza también aumenta 
y las conclusiones que se obtienen analizando el modelo son totalmente erróneas. En el apéndice de este capítulo se 


presenta la técnica más utilizada para verificar la suposición de varianzas homogéneas. 


El análisis del modelo Y, = u +t, + €; tiene la finalidad de comparar los efectos de los ż tratamientos. Para ese 
fin se propone la hipótesis nula Ho : T, =T, =-=1,. Dado que las alternativas a la hipótesis nula (igualdad 
de tratamientos) son múltiples, la hipótesis alternativa se enuncia en palabras como sigue: Ha : al menos uno de 
los tratamientos es distinto de los demás. Es fácil ver que en el modelo Y; = U; +£; el mismo juego de hipótesis 
tendría la expresión Ho: 4, = 4, === u, en oposición a Ha : al menos una 4, es distinta de las demás. En 
cualquiera de los dos casos es obvio que la estadística para probar Ho debe depender primordialmente de las 
medias (7..) de los tratamientos. El procedimiento, al igual que en el modelo simple Y, = u +€;, descansa en 
una partición adhoc de la variabilidad de las observaciones. 


Para obtener dicha partición considérese la igualdad: 


Y, Y. =(Y, Y.) +(%, Y.) (11.21) 


dondela desviación total de una observación con respecto ala media general del experimento ha sido descompuesta 
en dos fuentes de variación. La primera, Y; — Y,, tiene la siguiente explicación: para un tratamiento dado (el 
¡-ésimo), la diferencia entre Y, y Y,, se debe exclusivamente a la variabilidad experimental entre diferentes 
repeticiones del mismo tratamiento y, por tanto, es una desviación debida al error experimental. La segunda fuente 
de variación es Y, —Y,,, y, claramente, por ser una desviación entre la media del ¿-ésimo tratamiento y la media 
general del experimento, es una desviación que refleja las diferencias entre los tratamientos, ya que si todos los 
tratamientos tuvieran el mismo efecto, deberíamos esperar que las medias Y, fuesen iguales a la media general 
Y... Por esta razón a A —Y. se le llama una desviación debida a los tratamientos. Incorporando estos nombres a 


la ecuación (11.21) escribimos: 
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h-E = (ME) +  (.T) 
Desviación = Desviación + Desviación (11.22) 
total. debida al error. debida al tratamiento. 


Dado que las igualdades (11.21) y (11.22) se cumplen para todas las respuestas Y; (j = 1... 5=1,.t), 
podemos escribir: 


De donde: 


El doble producto en el lado derecho de la ecuación anterior es cero (ver ejercicio 11.7 al final de capítulo), por 
lo que se obtiene la siguiente partición de la suma de cuadrados total: 


= 
j 


i 


II 
M- 
M= 


Z-z m-f + ESE-rY 


j=l i=] j=l i=] j=l 


S.C. TOTAL = S.C. ERROR + S.C. TRATAMIENTOS (11.23) 


La expresión (11.23) puede simplificarse un poco si notamos que las variables en el segundo término del lado 
derecho no dependen del índice j, por lo que (11.23) puede reducirse a: 


n; ( Y.) 
1 


_ 
A 
| 
0 
5 
Il 
M> 


n; t 


R + 


i=] ¡=1 i=] j=l i 


S.G, TOTAL S.C. ERROR + S.C. TRATAMIENTOS (11.24) 


Las propiedades distribucionales de las sumas de cuadrados en (11.24) podrían derivarse (con algún esfuerzo) 
usando resultados ya conocidos, pero con objeto de no alargar demasiado nuestra presentación simplemente 
asentamos sin probar los siguientes resultados: 


t n; 


S.C. ERROR > 2 , 3 | 
A TS” A n —t 
a sl i=l (11.25) 


Además, si la hipótesis nula Ho : T} =T, =+ =T, es cierta, se tiene que: 
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S.C. TRATAMIENTOS _ 


g? 


Y» (Z. 


~% (t—1) 
(11.26) 


De donde, por la independencia entre las dos sumas de cuadrados consideradas previamente, se obtiene: 


S.C. TOTAL 


2 
e (11.27) 


Con estos resultados podemos reescribir la ecuación (11.23) mostrando las distribuciones de las sumas de 
cuadrados bajo la hipótesis nula, para dar origen a la ecuación (11.28): 


t n t pi t S 
2 EY ALRT Ya, (F. 7.) 
i=l j=l _ i=] j=l i=l 
g? g o? + 2 
S.C. TOTAL S.C. ERROR S.C. TRATAMIENTOS 
A E DE ASS 


x (Èn -1) x (Èn -t)+z 0-1) 


La partición de la variabilidad y las distribuciones presentadas en (11.28) nos permiten justificar una tabla de 
Análisis de la Varianza para la hipótesis nula de igualdad de tratamientos en el diseño completamente aleatorizado, 
utilizando una prueba de F. Con objeto de presentar la tabla con la columna que despliega las esperanzas de 
los cuadrados medios hacemos las siguientes consideraciones. La esperanza ” cuadrado medio del error es 
fácilmente obtenible, ya que S.C. ERROR / 07 tiene una distribución y? —+), independientemente de 
que la hipótesis nula sea cierta o no. Por tanto, y dado que una variable Be? Ji-cuadrada tiene una media 
que es igual a sus grados de libertad, tenemos que: 


(11.28) 


S.C. ERROR 


Ya + 


1 


Eq" 


E(C.M. ERROR) = z| E(S.C. ERROR) 


2 


o“ (E RR) 
= 5s — E| = 
S ny = O 


a O 
a 


dado que: 


(S.C. ERROR /0?) ~ x? (Xn, —1) 


a 


Entonces: 


2 


E(C.M. ERROR) = g 
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(11.29) 


Las otras esperanzas de cuadrados medios son más difíciles de obtener, por lo que el siguiente resultado se 


presenta sin prueba. 


5 ni (T; = 1) 


E(C.M. TRATAMIENTOS) = 0° + + i 
E 


donde: 


(11.30) 


En la Tabla 11.5 se resumen los resultados de esta sección mediante la tabla de A de V para el DCA. 


mn ; ' E EN? -1 
La estadística para la prueba es F) que, de acuerdo con resultados anteriores, tiene una distribución de BS 


cuando la hipótesis nula es cierta, por lo que la regla de decisión es: Rechazar Ho si F, > 


nt 
1 
n;—t,Q 


. Al igual que 


en el modelo más simple, podemos ver que toda la lógica de la prueba es transparente a través de las E.C.M. En 


efecto, es claro que: 


E(C.M. TRAT.) > E£(C.M. ERROR). 


Y la igualdad se cumple si todas y cada una de las T; son iguales a T y, por ende, iguales entre sí. Dicho 
brevemente, si la hipótesis nula es cierta. Consecuentemente, la región de rechazo para la prueba se localiza en 


la cola derecha de la distribución de F. 


Tabla 11.5. Análisis de varianza para el modelo Y, =4+T,+€j. 
Ho:T, =T,=""=T,. 


Ha : al menos el efecto de un tratamiento es diferente de los demás 


Fi enis de Grados de Libertad Suma de Cuadrados Cuadrado Medio Fo 
Variación 
t 
siae me Ne (7.-T.y S.C. TRAT. C.M. TRAT. 
a t-l C.M. ERROR 
j ká S.C. ERROR 
y am HA 
Error Sn, t 2 D (Ù; i ) Sn, -1 


Total Sn + > (1 7.) 


Esperanza del 
Cuadrado Medio 
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Las expresiones que aparecen en la Tabla 11.5 para las sumas de cuadrados son útiles porque en ellas es muy clara 


t 
la naturaleza de la variación que reflejan. En efecto, la S.C. TRAT. es $n, (F. Y, y , y es claro que depende 


i=l 


de la variabilidad de las medias de tratamientos. En cambio, puesto que S.C. ERROR = PARES Y. e 
E 


tenemos que depende de la variabilidad de las repeticiones de un mismo tratamiento. Por esta razón, en 
algunos textos a la fuente de variación que aquí hemos llamado tratamientos se le denomina entre poblaciones, 
mientras que a la del error se le llama dentro de poblaciones. Sin embargo, las expresiones para las S.C. son 
difíciles de evaluar tal como aparecen en la Tabla 11.5. A continuación se dan expresiones alternativas para 
cada una de las S.C. Las pruebas de las igualdades son sencillas y se presentan en un ejercicio (11.8) al final 
del capítulo. 


Ejemplo 11.3. En seguida calculamos la tabla de A de V para los datos del ejemplo 11.2. El formato que se 
presenta para los cálculos es quizá un poco elaborado, pero tiene ventajas que se discutirán después. 


Como se verá enseguida, las dos últimas hileras, que se dejaron fuera del cuadro para referencia, no son necesarias 
para llenar la tabla de A de V, pero nos ayudarán después para destacar ciertos puntos de interés. En primer lugar 
calculamos el factor de corrección: 


K Wy 


e 18 


i=] 


F.C. = = 76962.72 
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Tratamiento (marca) 


2 4 


27744.0 


23256.2 11532.0 14641.0 


NY? | 23295 11546 14682 
j=1 i=] j=l 
` 3 j 2 t Aij 5 t y? 
Sy- 388 14.0 41.0 580 DDr -9+ =151.8 
j=l k n; i=] j=] i=] n; 
a 9.7 7.0 13:67 11.6 
Las S.C. necesarias son: 
LY 2 
S.C. TRAT. = $ -—F.C.=77173.2-76962.72 = 210.48 
i=1 "i 
t n 


= 28% <= rs = 
S.C. TOTAL = Y) ») Y; —F.C. = 77325 — 76962.72 = 362.28 


¡=1 j=l 


Ahora, puesto que sabemos que S.C. TOTAL = S.C. TRAT. + S.C. ERROR, la S.C. ERROR puede obtenerse 


simplemente por diferencia: 


S.C. ERROR = S.C. TOTAL — S.C. TRAT. = 362.28 — 210.48 = 151.80. 


En seguida usamos estos resultados para llenar la tabla de A de V, pero antes hacemos una observación sobre 
los cálculos. La S.C. TOTAL involucra la suma de los cuadrados de cada una de las observaciones, es decir, en 


este ejemplo: 


Nr =(63) + (68)? +---+(66) 


i=] ¡=1 


T- 
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m mh 
; 2 2 > 
En el cuadro de cálculos esto se ha hecho por partes, calculando primero È Y; luego 2 Yz ;, etc. Así, por 
ejemplo: j=l j=l 


M 
Y) Y = (63) +(68)” +(71)? +(70) +(69}? = 23595 
j=l 

Después, al sumar sobre esa hilera las sumas parciales, se obtiene el resultado deseado. 


Tabla de A de V 


EV G.L. SC. C.M. Fy 
Tratamientos 3 210.48 70.16 6.47 
Error 14 151.80 10.84 
Total 17 362.28 


Para probar Ho:T, =T, =T, =T; en oposición a Ha : al menos un tratamiento es diferente de los demás, con 
a. =0.05, obtenemos F} 0.05 = 3.3439 de la tabla correspondiente y, puesto que F, > 3.3439, se rechaza Ho 
con 4 =0.05 y se concluye que al menos una marca de pan tiene diferente porcentaje de carbohidratos que las 
otras. La hipótesis nula se rechaza también con 4=0.01. 4 


Ahora volvemos a la tabla donde se calcularon las cantidades necesarias para llenar la tabla de A de V del 
ejemplo, para examinar las dos últimas hileras. Si observamos con cuidado la penúltima hilera vemos que está 
integrada por: 


m y? Aa y? 

2 le 2 ás 
O A 
j=l m j=1 M4 


y, en consecuencia, las componentes son simplemente las S.C. de desviaciones dentro de cada tratamiento, 
es decir, las S.C. del error en cada muestra, de modo que al sumar esa hilera se obtiene la S.C. ERROR, 
lo que nos proporciona una verificación conveniente del resultado obtenido previamente restando S.C. 
TRATAMIENTOS de S.C. TOTAL. Pero hay una observación de mayor importancia: las componentes de la 
hilera también son los numeradores de las varianzas muestrales en cada uno de los tratamientos (se recomienda 
al lector que verifique este hecho numéricamente). Por tanto, si dividimos cada suma de cuadrados por sus 
grados de libertad (7; —1), obtenemos las 4 varianzas muestrales que se presentan en la última hilera. Ahora 
bien, recuérdese que la suposición de varianzas iguales es muy importante en este modelo, y de hecho se ha 
usado para obtener el C.M. ERROR en la tabla de A de V, aunque esto no es evidente a primera vista. Sin 
embargo, puede probarse que: 


t t 


D(a -1) Y(n -1)S? 


C.M. ERROR = &— 2 


t 
Y (1, —1) Y n + 
¡=1 ¡=1 


(11.34) 
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como es fácil comprobar en el ejemplo 11.3. En efecto: 


À S: 
= 4(9.7)+2(7.0)+3(13.67) +5(11.6) 


d 14 


= 10.84 = C.M. ERROR 


De donde vemos que el C.M. ERROR, que es un estimador insesgado de o° siempre y cuando las varianzas de 
las poblaciones que se comparan sean iguales, es un estimador ponderado idéntico al usado en el caso +=2 en 
la sección 10.3. Si la suposición de homogeneidad de varianzas no es cierta, los resultados obtenidos mediante 
la tabla de A de V pueden ser totalmente incorrectos. Lo anterior puede visualizarse notando que la £(C.M. 
ERROR) será distinta de 0”, y toda la lógica de la prueba se derrumba. 


Con la discusión anterior completamos nuestra presentación del A de V para el Diseño Completamente 
Aleatorizado. En la sección 11.6 volveremos sobre el diseño para contestar una pregunta que quizá ya se haya 
formulado el lector: si la conclusión obtenida mediante el A de V es que los efectos de los tratamientos no son 
iguales, ¿cuál es el siguiente paso? Esta no es una pregunta importante cuando sólo se tienen dos tratamientos, 
ya que entonces las conclusiones son muy obvias. En el caso de varios tratamientos la pregunta es capital, ya 
que lo que interesa saber es si hay algún tratamiento que sea claramente superior (o inferior) a los demás; si 
dos tratamientos son equivalentes, etc. Como veremos después, el A de V debería ser simplemente una de las 
técnicas (y quizá no la más importante) en el análisis estadístico de los datos de un experimento. 


11.5. Análisis de la varianza en el diseño en bloques aleatorizados completos 


La idea de formar grupos (bloques) de ż unidades experimentales tan semejantes como sea posible y de comparar 
t tratamientos dentro cada uno de los bloques fue expuesta en detalle en la sección 10.2, aunque en secciones 
posteriores del capítulo 10 se hizo referencia únicamente al caso £ = 2, por la sencilla razón de que la herramienta 
de que disponíamos (la prueba de 1) no nos permitía tratar casos más generales. Ahora exponemos el caso general 
usando (y extendiendo) la técnica del modelo lineal que hemos venido desarrollando en este capítulo. En esta 
sección no seremos tan prolijos como en las anteriores en la explicación del modelo lineal para el análisis, 
operando bajo la suposición de que el lector ya ha asimilado las ideas básicas de un modelo lineal. 


En primer lugar, describimos el proceso de aleatorización que caracteriza a este diseño y que da origen al 
modelo lineal para su análisis. Se va a comparar ż tratamientos y cada tratamiento debe estar presente una y 
sólo una vez en cada uno de los bloques, es decir, que si se tienen $ bloques, cada uno de ellos está integrado 
exactamente por + unidades experimentales. En consecuencia, el número total de unidades experimentales es 
bt, y además cada tratamiento tiene el mismo número (b) de repeticiones; primera diferencia importante con el 
Diseño Completamente Aleatorizado, donde cada tratamiento puede (aunque no es forzoso) tener un número 
diferente de repeticiones. La asignación de los tratamientos a las unidades experimentales se realiza como sigue: 
en un bloque cualquiera, digamos el primero, se numeran las ż unidades que lo integran y se colocan en una 
urna £ fichas idénticas, excepto por estar marcadas por números entre 1 y £. En otra urna se colocan + fichas que 
identifican a los tratamientos. De cada urna se extrae una ficha para asignar un tratamiento a la primera unidad 
experimental extraída. En seguida, sin regresar las fichas a las urnas respectivas, se repiten las extracciones hasta 
haber asignado los ż tratamientos a las unidades en ese bloque. Una vez terminada la aleatorización para ese 
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bloque, se repite todo el proceso de nuevo con un segundo bloque, y así sucesivamente hasta terminar con los 
b bloques. De ninguna manera es válido hacer una aleatorización para un bloque y usarla en los demás. La forma 
en que se aleatoriza el diseño es la que le da su nombre. Nótese que dentro de cada bloque la aleatorización es 
irrestricta para una repetición de cada tratamiento, pero la aleatorización no es irrestricta para las bt unidades 
experimentales, ya que en cada bloque sólo puede aparecer un tratamiento una vez. El nombre Diseño en 
Bloques Aleatorizados Completos (DBAC) se usa para distinguirlo de otros diseños (que no se presentan en 
este libro) donde los bloques tienen menos de + unidades experimentales y por tanto son bloques incompletos. 


La notación que usaremos para identificar a las respuestas es la misma que en el diseño anterior. Y; es la 
respuesta, en la j-ésima repetición, del ¡-ésimo tratamiento. El índice ¿puede tomar cualquier valor entre 1 
y 1, pero en este caso j siempre toma valores entre 1 y b, independientemente del valor de ¡, ya que todos los 
tratamientos tienen el mismo número de repeticiones. En la Tabla 11.6 se presenta la estructura de los datos 
para este diseño. 


En la Tabla 11.6 aparecen dos columnas que no se tenían en el DCA. Éstas son para los totales y medias de 
bloques. Como veremos después, esas columnas son necesarias para calcular la tabla de A de V. Claramente: 


Y = Xy ¡=L 20h 
i=] 


(11.35) 
y 
=- $ aë 
Y.; = J =; ¡=1,2,...,b 
E t (11.36) 
Además: 
b t $ $ 
Ka =>) Y, = NY, =5 Y, 
J=] i=] i=] j=] (11.37) 


Totales Medias 
de bloque de bloque 
Y, 
£ 


Totales de tratamiento 


Medias de tratamiento Y. Y. si F. 
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Aquí las medias de tratamientos y la media general se definen exactamente como en el DCA, excepto que ahora 
todas las medias de tratamientos tienen el mismo divisor (4). 


El modelo lineal para el diseño es simplemente una extensión del que se adoptó para el DCA, suponiendo ahora 
que además de las componentes 4 y T; que ya se tenían, interviene un efecto atribuible al bloque en que se 
encuentra una unidad experimental. El modelo se describe en el siguiente recuadro. 


En seguida se presenta un ejemplo para ubicar las ideas anteriores en un contexto concreto. 


Ejemplo 11.4. En un experimento se quiere comparar las capacidades de reproducción de frecuencias 
bajas de 4 recubrimientos de cinta magnética, y se van a efectuar cinco observaciones con cada uno. El 
experimento podría realizarse en un DCA, simplemente obteniendo las 20 mediciones con la misma máquina 
reproductora y aleatorizando el orden de las 20 observaciones. Nótese que aquí una unidad experimental 
está definida por el orden de la observación. A pesar de lo anterior, el experimentador decide que es 
conveniente probar los tratamientos bajo condiciones más diversas, y se propone utilizar cinco diferentes 
grabadoras para el experimento, utilizando cada grabadora como un bloque en el que se probarán los 4 
tratamientos (recubrimientos). El propósito del experimento no es comparar las grabadoras, las cuales han sido 
escogidas precisamente porque son de diferentes calidades, sino comparar los 4 recubrimientos. En este caso usar 
cuatro grabadoras (bloques) distintas tiene el único propósito de que las conclusiones del experimento sean 
válidas bajo diversas condiciones. Se supone que el uso de varias grabadoras no introducirá mayor error en el 
diseño porque las frecuencias se compararán exclusivamente dentro de cada bloque. Una vez realizadas las 20 
observaciones se obtienen los siguientes resultados. Las respuestas son las frecuencias mínimas reproducidas 
(en Hertz): 
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e 25.2 15.2 32.2 23.6 


Posteriormente completaremos el análisis de estos datos. Por el momento se presentan con objeto de que el 
lector se familiarice con la estructura de los datos de un DBAC, y para remarcar la idea de que el término Ê; es 
indispensable en el modelo lineal para remover la variabilidad debida al efecto de los bloques. 4 


El A de V para el diseño se basa de nuevo en una descomposición de la variabilidad de las observaciones. La 
expresión que usamos como punto de partida es: 


QA = Ms] +. ME) + EA 
Desviación _ Desviación Desviación Desviación 
total T debida al error + debida al tratamiento debida al bloque 
(11.38) 
Tomando el cuadrado de (11.38), y sumando sobre todas las respuestas obtenemos: 
ob > E de E L a AS 2 
(Y) -FY = (0, YT, +7.) +(7, 7.) +(Z, -F.)] 
i=] j=] ¡=1 j=l (11.39) 


La reducción de (11.38) a una expresión más fácil de entender se realiza mediante un proceso algebraico un poco 
extenso, por lo que solamente presentaremos la ecuación que resulta: 


i gal (11.40) 
Presentando los elementos de (11.40) con los nombres con los que se les identifica tenemos, en el mismo orden: 


S.C. TOTAL = S.C. ERROR + S.C. TRAT. + S.C. BLOQUES (11.41) 


Asociadas con estas S.C. tenemos distribuciones Ji-cuadrada que dan origen a una prueba de F para la hipótesis 


Ho:T, =T, => =T, contra Ha : al menos un efecto de tratamiento es diferente de los demás. En la Tabla 
11.7 se presenta la tabla A de V incluyendo los grados de libertad de las distribuciones Ji-cuadrada asociadas, y 


en 
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las E.C.M. que sustentan la lógica de la prueba. En este modelo es aún más difícil (con las herramientas de que 
disponemos) justificar las distribuciones de las S.C. y derivar las E.C.M., por lo que presentamos los resultados 
sin probarlos. Finalmente, debe notarse que las S.C. en la Tabla 11.7 son simplificaciones algebraicas sencillas de 
las que aparecen en la expresión (11.40). Las de la Tabla 11.7 se presentan por ser sencillas de calcular, en tanto 
que las de la expresión (11.40) ilustran la naturaleza de la variabilidad que representan. Esto es particularmente 


cierto en los componentes S.C. BLOQUES =+) (Y, —Y., y y S.C. TRATAMIENTOS =5 (5, —Y.), 
que claramente miden la variabilidad de las medias de bloques y tratamientos, respectivamente, con respecto a 
la media general del experimento. 


Tabla 11.7. Análisis de Varianza para el Diseño en Bloques Aleatorizados Completos (DBAC) 
Modelo: Y; =4+T,+8,+€,,5=1,....t; ¡=1,...,b. 
Ho:T,=T, 


=1,. 


Ha : Al menos el efecto de un tratamiento es distinto de los demás. 


EV GI: SE C.M. Fo E.C.M. 
t y? y? E 2 
Tratamientos t—1l Nm S.C. TRAT. _C.M. TRAT. AA T) 
mb br t-l C.M. ERROR F 
b y? y? 
Bl b= = 
oques 2 T 
t b t 2 by? 2 
Y, O S.C. ERROR 
E (-1)(6—1) Yy? -Y-Y SS 2 
PPR 22 j 2 í 2 > R (-D6-D) o 
t b á y? 
Total bt—1 SAN 


Con la Tabla 11.7 el procedimiento para probar el juego de hipótesis propuesto es muy simple. Bajo Ho, 
Ho, R ~ Aia» por lo que la regla de decisión es: Rechazar Ho si F) > si 


En la Tabla 11.7 es claro que tanto las S.C. como los grados de libertad debidos a tratamientos, bloques y error, 
sumados son iguales a las S.C. y grados de libertad del total. Debe notarse además que en la tabla se muestran 
únicamente los C.M. de tratamientos y del error. La razón es que son los únicos C.M. que intervienen para 
probar la hipótesis de igualdad de efectos de tratamientos. 


Finalmente se sugiere al lector que examine cuidadosamente las E.C.M. de tratamientos y del error para que 
concluya que en éste, como en los modelos anteriores, las desviaciones de Ho tienen el efecto de aumentar E(C.M. 
TRAT.) y, por tanto, es lógico que la región de rechazo para Ho esté en la cola derecha de la distribución de F. 
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Ejemplo 11.5. Ahora calculamos la tabla de A de V para los datos del ejemplo 11.4, donde se describió un 
experimento en un DBAC para comparar la eficiencia de reproducción de frecuencias bajas de 4 recubrimientos 
para cinta magnética. 


Los datos, junto con las estadísticas necesarias para llenar la Tabla 11.7, se presentan en seguida. 


F. 25.2 15.2 32.2 23.6 
y 15876 5776 25921 13924 
DY; 3324 1266 5307 2818 12715 


Con los datos obtenidos calculamos, en primer lugar, el factor de corrección: 


Y? (481) 
HG añil 2H =11568.05 
E 20 
En seguida obtenemos la S.C. TOTAL. Ésta es: 
t b n y? t b > 
$. TOTAL= EEN =32=2 26 =FC 


¡=] ¡=1 i=] j=l 


= (20) +00 +.-+(23) +(20)? RG. 
=12715-11568.05=1146.95 


(El lector debe notar que la cantidad 12715 se obtuvo mediante sumas parciales en la tabla de cálculos.) 
Además: 


> 


ye 


S.C. TRAT.= Y 


i=] 
_ (126) +(76° +0161) +(118)} 
5 


—11568.05 = 731.35 


=R 


F.C. 
_ 61497 
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La S.C. BLOQUES se calcula con igual facilidad: 


b y? 
S.C. BLOQUES = Y F.C. 
t 


j=l 

— (82? +0115% +0115} +76 +03} _ 0 
AA 

_ 47599 


Er 11568.05 = 331.70 


Finalmente, puesto que S.C. TRAT. + S.C. BLOQUES + S.C. ERROR = S.C. TOTAL, la S.C. ERROR 


puede calcularse por diferencia: 


S.C. ERROR = S.C. TOTAL =S.C. TRAT.—S.C. BLOQUES 
= 1146.95 — 731.35 — 331.70 = 83.90 


Con estos resultados llenamos la tabla de A de V. 


EV: G.L. SC, C.M. F 
Tratamientos 3 731.35 243.78 34.88 
Bloques 4 331.70 
Error 12 83.90 6.99 
Total 19 1146.95 


Para probar Ho:T, =T, =T} =T; en oposición a Ha : al menos un tratamiento diferente con nivel æ de 
significancia, requerimos Kiz El lector debe verificar que F, > pc para 4=0.10,04=0.05 y a=0.01, 
por lo que la conclusión es rechazar Ho con cualquier æ > 0.01. Es decir, que al menos un recubrimiento tiene 
diferente capacidad de reproducir frecuencias bajas que los demás (a > 0.01). 


A continuación presentamos un segundo ejemplo de DBAC, en el cual la elección del diseño está determinada 
por la necesidad de eliminar una fuente de variabilidad que ya existe en el material experimental. 


Ejemplo 11.6. En un campo agrícola experimental se van a comparar tres variedades de maíz, con 6 repeticiones 
para cada variedad, o sea que se tienen 18 unidades experimentales (parcelas de igual tamaño y forma en este caso). 
Una opción es realizar el experimento con aleatorización irrestricta, pero el investigador sabe que la fertilidad del 
suelo en el terreno disponible es tan variable que los resultados de un experimento con aleatorización irrestricta 
pueden contaminarse por esa variabilidad. En cambio, su conocimiento del terreno le permite formar bloques 
de tres unidades experimentales adyacentes dentro de los cuales la fertilidad del suelo es más homogénea y, por 
tanto, decide realizar un experimento en bloques aleatorizados completos. En este caso += 3 y b = 6. 


Antes de continuar con el ejemplo vale la pena mencionar que experimentos como el descrito son los más frecuentes en 
las ciencias agrícolas. De hecho, la idea de bloque se originó en esta área experimental, con la lógica de que unidades de 
terreno cercanas deben tener una fertilidad similar, dando un criterio válido para el agrupamiento. Esta idea no solo 
es razonable, sino que es un excelente ejemplo de creatividad científica. Desafortunadamente, planear experimentos 
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con bloques se ha vuelto tan rutinario en la investigación agrícola que el investigador raras veces se detiene a pensar si 
el criterio de agrupación reduce la variabilidad en grado suficiente para compensar la pérdida de grados de libertad en 
el C.M. ERROR. Nótese que con un DCA, en el ejemplo que estamos examinando, se tendrían 15 grados de libertad 
para el error, mientras que en el DBAC sólo se tienen 10. El mensaje que queremos enviar es que realizar experimentos 
en bloques no es necesariamente mejor que hacerlos con aleatorización irrestricta. 


Pero, dejando de lado la digresión anterior, supongamos que el experimento descrito se realizó en bloques 
aleatorizados completos. En la siguiente tabla se presentan los resultados y cálculos parciales necesarios para 
obtener las S.C. Los números en la tabla son rendimientos en kgX Ha. 


Tratamiento Ñ 
(variedad) Y; Y; 
2.78 278.89 
2.88 299.29 
2.93 309.76 
6.3 887.94 
Y. 2.1 2.9 3.4 3.5 3.0 2.3 
y 39.69 75.69 104.04 110.25 81.00 47.61 458.28 


2 13.31 25.31 34.82 36.77 27.02 16.01 


Con estos datos calculamos: 


2 2 
SE -GLO 147.97 


FG. 
bt 18 


S.C. TOTAL =(2.3* +(2.1)? +---+(2.4)? —F.C. 
=153.24-147.92=5.32 


(16.7) +(17.3 +(17.67 _ 


S.C. TRAT. = 6 F.C. 
94 
Ps —147.92 = 0.07 
3Y +(8.7) +---+(6.9) 
S.C. BLOQUES CIAT AHI y 


3 


= 2, 147.92 = 4.84 
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De donde: 


S.C. ERROR =S.C. TOTAL—S.C. TRAT.—S.C. BLOQUES 
= 5.32 — 0.07 — 4.84 = 0.41 


Enseguida se presenta la tabla de A de V. 


EV GL, SE C.M. F 
Tratamientos 2 0.07 0.035 0.8537 
Bloques 5 4.84 
Error 10 0.41 0.041 
Total 17 5.32 


Para probar Ho:T, =T, =T; en oposición a Ha : al menos un efecto de las variedades es diferente con 
G 2 ., . 

a =0.10, comparamos F, con Fó010 = 2.9245. Puesto que F, < 2.9245, la conclusión es que con un nivel 

de significancia de 0.10 las 3 variedades de maíz tienen el mismo rendimiento. 


11.6. Después del A de V (Contrastes y un método sencillo para comparaciones 
múltiples) 


Después de probar la igualdad de tratamientos mediante la prueba de F queda el problema de decidir cuál o 
cuáles son los tratamientos que ocasionan el rechazo de Ho en el A de V. Como es evidente de las E.C.M., la 
hipótesis nula puede rechazarse porque una de las T; es muy diferente de las otras o porque varias difieren. A 
tratar de contestar esta pregunta se han dedicado innumerables estudios en la literatura estadística, y hasta el 
momento no hay acuerdo completo entre los estadísticos profesionales sobre el mejor procedimiento. En esta 
sección presentaremos dos formas de hacer un análisis más detallado que el precedente para los datos de un 
experimento, ya sea en DCA o en DBAC. 


En primer lugar discutimos el análisis de la variabilidad de las medias usando Contrastes. 


Definición 11.1 (Contraste). Sean 0, 0,,..., 0, parámetros desconocidos, y sean c}, C,,..., C Constantes conocidas. 
k k 
Se dice que Q = S c/0, es un contraste de los parámetros 0); si Ye =0 4 


i=] i=l 


El concepto de contraste tiene muchas aplicaciones en estadística, pero ahora nos limitaremos a explotarlo 
primero en el DCA y posteriormente en el DBAC. 


En el modelo Y, = u +t; +£; tenemos muestras de ż poblaciones normales y, por tanto, £ medias muestrales 


AAA F.) para estimar las medias poblacionales respectivas. En seguida veremos cómo usarlas para inferir 
t 


t 
sobre contrastes de las T;. Sea Q = » c;T; un contraste y considérese la estadística Q = S c;Y;, como estimador 


i=] j= 


de Q. Primero vemos que en el modelo para el DCA: 
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Y 1 Yi2»..» Y ,, son independientes Nu +1,,07) 


MM 


Yri» Ya2».. Yan, son independientes N (u F 7,0”) 


Y; Y 7 ,..., Y, son independientes N (u Pi „o? ) 


tn, 


De aquí que las medias muestrales sean tales que: 


Y= Nlu+r,0? In,); 1=1,2,...P 


Pero, además, puesto que las ż muestras son independientes, las medias muestrales también lo son. De donde, de 


acuerdo con (10.3), tendríamos que la variable aleatoria Q = a es Normal, con media: 


i=l 


T kag 


c(u+rt; )= DE e os puesto que Y: = 
=] i=l 


i=l 


La varianza de Q es: 


var()= va Sa) Se Var(Y,) = Sein, 
i=] 


i=] i=l 


Resumiendo: 


t t 
20Y; ~ n$e c¡T den 
i=l 


(11.42) 


El lector notará que Sar c¡Y;, es un estimador insesgado del contraste Y et ¿ porque Y e, =0, y esa es la 
razón de especificar la restricción en la definición 11.1. Por otra parte, la expresión (11.42) nos permite probar 
hipótesis sobre SN cr ¿ con el método que a estas alturas debe ser familiar (hasta la náusea) al lector. Antes de 


usar la técnica de contrastes en los datos del ejemplo 11.3 presentamos un ejemplo muy sencillo. 


Ejemplo 11.7. Supóngase que sólo se tienen dos tratamientos y las dos medias muestrales Y. y Y,, . Un contraste 
entre T} y T¿ es Q =T, —T), donde c, =1 y c =—1. Claramente Ye =1+(-1)=0. El ostitnador Q es 
=> P. con distribución: 


mediante una aplicación simple de (11.42). 
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De manera que la prueba del juego de hipótesis Ho:T, =T, en oposición a Ha:T, %T,, que equivale a 
q P Jueg P = p Letz QUE 
probar igualdad de tratamientos, puede hacerse mediante la distribución de £ con la estadística: 


2 ; : 2 ia : mm” 

donde S” es un estimador insesgado de O”. Los valores críticos para la prueba se obtienen de la distribución 
2 ? 

de + con los grados de libertad que tenga $”. Por supuesto, ésta es la prueba propuesta para comparar dos 

tratamientos en la sección 10.3, de modo que allí se hizo una aplicación simple de la técnica de contrastes. 6 


Enseguida presentamos un ejemplo donde se muestra cómo explorar con detalle las posibles diferencias entre 
los tratamientos en un DCA utilizando contrastes. Si la técnica de contrastes se utiliza después de realizar el A de 
V, ya se cuenta con un estimador de O”, concretamente el Cuadrado Medio del Error, y los grados de libertad para la 
prueba del contraste son los de éste. Ésta es la razón de que se presente la técnica después del A de V, a pesar de 
que podría haberse desarrollado antes. 


Ejemplo 11.8. En el ejemplo 11.3 se compararon cuatro marcas comerciales de pan con respecto al porcentaje de 
carbohidratos en cada una de ellas. Las medias, los tamaños de cada muestra y la tabla de A de V se reproducen 
a continuación: 


Y. =68.2, Y, =62.0, Y,, =60.5, Y, =68.0, 


n = 5, n = 3, n, = 4, n; = 6, 
EV. G.L. SG C.M. Fy 
Tratamientos 3 210.48 70.16 6.47 
Error 14 151.80 10.84 
Total 17 362.28 


La conclusión en el ejemplo 11.3 fue que, con a = 0.01, los efectos de los tratamientos son distintos o, más 
precisamente, que al menos uno es distinto. Con la técnica de contrastes podemos hacer preguntas más concretas, 
por ejemplo: ¿son diferentes los efectos de los tratamientos 2 y 3? ¿Es diferente el efecto del tratamiento 1 del 
promedio de los efectos de los tratamientos 3 y 4? etc. Enseguida planteamos contrastes para las preguntas 
anteriores. Para investigar si T, es diferente de T, formulamos el contraste Q =T, — T3. En la siguiente tabla se 
proporciona un resumen conveniente de los cálculos. Para comprenderlo mejor recomendamos al lector que 
tenga a la vista la ecuación 11.42. 


Parámetros (7;) 


Coeficientes (c;) 0 1 -1 0 Y e, =0 
Medias (Y,,) 68.2 620 605 680 |[Q=Dct,=1,-T) 
Tamaños de muestra (»,) Q=) «Y. =1.5 
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Por (11.42): 


2 


ĝ Se consigue sustituyendo 0” por el C.M.E. obtenido de la tabla de A de V. En este caso: 


Un estimador de o 


Só = (0.5833)(10.84) = 6.323 


Probar T, =T; en oposición a T, % T3 es equivalente a probar Ho:Q =0 en oposición a Ha: Q % 0, donde 
Q =T, —Tj. Por tanto, la estadística adecuada es: 


la cual debe compararse con £¿,,(14) para decidir si se rechaza Ho con un nivel æ de significancia (Los G. 
L. son los del C.M.E. en la tabla de A de V). De la tabla de ż vemos que Ho no se rechaza para ninguna a 
razonable, por lo que concluimos que no hay diferencia entre los porcentajes de carbohidratos de las marcas 
2 y 3. 

Ahora formulamos un contraste para investigar si hay diferencias entre el efecto del tratamiento 1 y el promedio 


1 
de los efectos de los tratamientos 3 y 4. Una forma es con el contraste T, =z +T; ), y otra mediante 


2T; —T3 —T4. Aquí usaremos el primero, pero pedimos al lector que verifique que el valor de la estadística de 
prueba es el mismo con el segundo contraste. 


En la tabla se resumen los cálculos. 


Parámetros (T; ) Ti T2 T3 T4 


Coeficientes (c;) 1 0 -1/2 1/2 


Medias (Y,.) 68.2 620 60.5 68.0 


Tamaños de muestra (7; ) 


Además: 
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Só = (0.304)(10.84) = 3.295 


de modo que la hipótesis Ho:Q =0 en oposición a Ha :Q #0 se prueba mediante: 


3.950 


t, Lod 
% 43.295 


= 2.176 


Los puntos críticos con 4=0.05 son to o25(14) = 2.145 y —to.025(14) =-2.145, por lo que se concluye que 
el porcentaje de carbohidratos en la marca 1 es diferente del promedio en las marcas 3 y 4, con un nivel de 
significancia de 0.05. 6 


En este punto debe ser claro que el número de contrastes que pueden hacerse con varios tratamientos es 
inacabable, y debemos señalar que esta técnica alcanza su máxima utilidad cuando se aplica a comparaciones 
planeadas por el investigador antes de obtener los datos del experimento. En caso contrario se presta a que se 
manipulen los datos. 


Un ejemplo interesante de contraste planeado de antemano se tiene en el ejemplo 11.8, si consideramos que 
las marcas 1 y 4 se elaboran con harina blanca y las marcas 2 y 3 con harina de trigo entero. Con el contraste 
Q =T; +T¿—T),—Tjy se puede comparar el porcentaje de carbohidratos en los panes con harina blanca y los 
elaborados con harina de trigo entero. 


Antes de usar el método de contrastes en un DBAC, hacemos notar que el procedimiento no tiene por qué 
limitarse a probar Ho :Q =0 en oposición a Ha : Q % 0. Cualquier valor arbitrario k puede usarse en vez de 
cero con la estadística de prueba: 


Q-k 
A 
|cMEJ E 
A; 


y también pueden hacerse pruebas de una sola cola. Los G.L. son los del C.M.E. en la tabla de A de V, y los 
valores críticos se toman de la tabla de + correspondiente. La cola de rechazo depende de Ha, como en cualquier 
prueba sobre la media de una normal. 


, 


En el caso de un DBAC, definiendo como antes Q = hs CGT; y Q = p> c;Y,. encontramos, por un procedimiento 
similar al usado en el DCA, que: 


m: 
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m (11.43) 


de manera que la situación es similar, si bien un poco más sencilla que en el DCA. Más sencilla porque en el 
DBAC n; =b(i=1,...,t), y se simplifica el cálculo de la varianza de Q (comparar (11.42) y (11.43)). Por lo 
demás, el procedimiento para probar hipótesis sobre un contraste es el mismo en los dos diseños, según se ilustra 
en el ejemplo 11.9. 


Ejemplo 11.9. En el ejemplo 11.5 se analizó un DBAC para comparar las capacidades de reproducción de 
frecuencias bajas de cuatro recubrimientos para cinta magnética, con cinco repeticiones por tratamiento 
(b =5). Las medias de tratamientos y la tabla de A de Vse reproducen en seguida. 


,=252, 1, =192, E, =322 Y, =23:6 


i A 
EV. GL SC. C.M. Fo 


Tratamientos 3 731.35 243.78 34.88 


Bloques 4 331.70 
Error 12 83.90 6.99 


noaa T O 
Total 19 1146.95 
n E A 


Con el propósito de plantear contrastes que reflejen las intenciones del investigador desde antes de realizar 
el experimento, proporcionamos al lector la siguiente información adicional. El recubrimiento usado en el 
tratamiento 3 contiene los ingredientes usuales en las cintas conocidas en el mercado como “Normales”. Los 
tratamientos 1 y 4 corresponden a cintas llamadas “De cromo”, y el tratamiento 2 al tipo de cintas llamadas 
“Metálicas”. Tenemos entonces: 


Cintas Normales (Trat. 3): É, = 32.2. 

Cintas de Cromo (Trats. 1 y 4): E = 25.2, Y, = 23.6 

Cintas Metálicas (Trat. 2): 5 =15.2. 

Algunas preguntas de interés serían: con respecto a la capacidad de reproducción de frecuencias bajas, ¿hay 


diferencias entre las cintas de cromo y las normales? ¿Entre las cintas normales y las metálicas? ¿Entre los dos 
recubrimientos de cromo? etc. Contrastes apropiados para estas tres preguntas serían: 


Q =T, +T; —2T3, Q, =T, —T3, Q3 =T,—T, 


Como ilustración haremos una prueba para Q, 
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Parámetros (T,) 


i = — 
Coeficientes (c; ) Q=1,+7,-2T; 


Medias (F, ) Q si 


De donde, por (11.43), un estimador de 0% es: 


Y por tanto, para probar Ho:Q =0 en oposición a Ha:Q #0 , la estadística toma el valor: 


Q-0 -=156 —15.6 
“o So /8.388 2.896 


Con & =0.01 obtenemos to o05(12) = 3.055, y dado que 1, <—3.055 concluimos, con & = 0.01, que sí hay 
diferencia entre la capacidad de reproducción de las cintas de cromo y las normales, con evidencia a favor de las 
de cromo, ya que reproducen frecuencias más bajas. 


Para finalizar el ejemplo ilustramos lo que se dijo antes sobre que no necesariamente la hipótesis nula para un 
contraste especifica el valor cero. Supongamos que el costo (mayor) de una cinta metálica sólo se justifica si 
registra frecuencias más de 10 Hz abajo de las cintas normales, es decir, si Q =T} — T, >10. Queremos probar 
entonces: 


Ho:Q <10 en oposición a Ha:Q >10 
Para este problema: 
Q=Y,.-Y,. =32.2-15.2=17 


6.99 
2 am ns = 
So ai (2) = 2.796 


Entonces: 


y la hipótesis se rechaza con 4 = 0.01, ya que £,p,(12)=2.681 (la hipótesis es de una cola). O sea que con 
a. = 0.01 la cinta metálica mejora la respuesta a frecuencias bajas en más de 10 Hz con respecto a la normal. 6 


1- 
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En vez de las pruebas de hipótesis discutidas podrían establecerse intervalos de confianza para los contrastes de 
interés. Esto no involucra ninguna idea nueva y el método se resume en seguida. 


En opinión de los autores, la técnica de contrastes es la más útil para contestar las preguntas relevantes en una 
investigación típica, y en general es suficientemente usada en conjunción con el A de V. Sin embargo, una 
pregunta frecuente de los investigadores es cómo pueden llegar a conclusiones que sean válidas simultáneamente 
para varias comparaciones, por ejemplo, para todas las comparaciones posibles de las medias, tomadas de dos 
en dos. 


Esta inquietud ha dado origen a una serie de técnicas que se conocen como Técnicas de Comparaciones Múltiples, 
entre las cuales destacan las llamadas de Tukey, de Scheffé, de Duncan, de Student-Newman-Keuls y la Diferencia 
Minima Significativa (D.M.S.). La mayor parte de estas técnicas aparecen descritas a nivel metodológico y con 
ejemplos en la referencia 11.A.3, y con mayor énfasis en la teoría en la referencia 11.A.2. Aquí sólo discutiremos 
una modificación de la D.M.S., la cual tiene una conexión directa con el método de contrastes estudiado en 
esta sección. 


Cualquier diferencia entre dos efectos de tratamientos r y r’ se representa por el contraste Q =T, —T,, donde 
gq y Pp 7 

los coeficientes son c, =1,c, =—1 y c; =0 para los demás coeficientes. Si en un experimento intervienen t 
t t(t—1) 


> contrastes comparando dos medias. 


tratamientos, pueden hacerse 


Un procedimiento posible es hacer pruebas o intervalos de confianza individuales para cada uno de los 


contrastes. El método lo hemos desarrollado en las páginas precedentes. Para el contraste Q =T, ~T, podemos 
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probar Ho:Q =0 en oposición a Ha :Q #0 usando el estimador Q =Y, —Y... En un DCA la estadística 
de prueba sería: 


Pek 


(11.45) 


y en un DBAC: 


E o 
9 y2 C.M.E./b (11.46) 


ya que en el DBAC; n, = n, =b. 


De (11.45) y (11.46) se deduce que los intervalos de confianza 1— & para T, —T, serían, en el DCA: 


(11.47) 


o ME. 
Y.—Y,. +t, (G.L.C.M.E.), pa 
b (11.48) 


t 
En cualquiera de los dos casos es fácil construir > pruebas o intervalos de confianza individuales y decidir 


y en el DBAC: 


que aquellos pares de medias para los que se rechaza Ho, o cuyo intervalo de confianza no cubre a cero, son de 
poblaciones con medias distintas. El problema es que las pruebas o intervalos de confianza no son independientes. 
La consecuencia es que si las pruebas individuales se hacen todas con un nivel de significancia q, la afirmación 
conjunta que puede hacerse sobre todas ellas tiene un nivel de significancia desconocido, del cual sólo sabemos 
que es mayor que & y que aumenta a medida que el número de medias involucradas es mayor. 


Una característica común de todas las técnicas de comparaciones múltiples que se mencionaron antes es que 
tratan de mantener el nivel de significancia conjunto para todas las comparaciones lo más cerca de que sea 
posible. El método que describimos en seguida es un poco tosco, pero lo presentamos por ser muy sencillo de 
aplicar y porque, usado adecuadamente, da resultados confiables. 


El método de la Diferencia Mínima Significativa Modificada, que ahora presentamos, consiste básicamente en 
realizar todas las comparaciones individuales de interés a un nivel de significancia inversamente proporcional al 
número de comparaciones que se van a hacer. Concretamente, si se van a hacer / comparaciones individuales, 
y se desea un nivel de significancia & para la inferencia conjunta, cada prueba individual se hace a un nivel de 
significancia (+ / /. El lector debe notar que, si se tienen 3 medias y se quiere comparar de dos en dos todas 


__ 
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ellas, las 3 comparaciones individuales se harán con nivel de significancia &/3; si se tienen 4 medias, las 6 
comparaciones se harán con (4/6, etc. El resultado de tomar æ@// en la distribución de + es, como puede 
verificarse en (11.47) y (11.48), hacer mayores las anchuras de los intervalos de confianza individuales y, por 
ende, mantener un nivel de confianza cercano a & para la inferencia conjunta. En el siguiente recuadro se resume 
la discusión anterior, concentrándonos en los intervalos de confianza conjuntos. 


Ejemplo 11.10. En seguida aplicamos la técnica recién descrita al experimento con DCA analizado en los 
ejemplos 11.2, 11.3 y 11.8. Los datos que ahora requerimos son: 


Y, =68.2, Y, =62.0, Y,, =60.5, Y, =68.0 
n =5, m= 3, n, = 4, n, = 6, 
C.M.E. = 10.84, con 14 grados de libertad. 


> 


4 
Si se desean todos los pares de comparaciones hay | 3] 6 de ellas, por lo que taj; en (11.49) es tanz. 


Supongamos que se quiere œ = 0.06; entonces requerimos el valor £y y95(14) = 2.977 para obtener los 6 intervalos 
de confianza. Ilustramos el procedimiento con el contraste T} — T}. En ese caso: 
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L = (68.2 — 62.0)— 2.977 10.84 + ) 0.9578 


| = 
w | —= 


L = (68.2 — 62.0) + 2.977 iosa] + )=13.3578. 


v| —= 
w |= 


Los otros 5 intervalos se calculan de manera similar, y los resultados se resumen enseguida: 


Diferencia Intervalo de confianza (a = 0.06) 
T-T (—0.9578, 13.3578) 
T-T (1.1249, 14.2751)* 

Ty Ta (5.7351, 6.1351) 
Ta T (—5.9860, 8.9860) 
tE (-12.9307, 0.9307) 
T¿—Ta (-13.8269, —1.1731)* 


* Tratamientos con efectos distintos. 


De acuerdo con los resultados anteriores, y con base en los intervalos que cubren a cero, podemos decir con 
un nivel aproximado de confianza del 6% que el tratamiento 1 tiene el mismo efecto que el tratamiento 2 y 
el tratamiento 4. Además, el tratamiento 2 es igual al 3 y también al 4. En cambio, los tratamientos 1 y 3 son 
distintos en sus efectos y también lo son los tratamientos 3 y 4. ® 


Para finalizar el capítulo presentamos un ejemplo de esta técnica de comparaciones múltiples en un DBAC. 


Ejemplo 11.11. Utilizaremos los datos del DBAC analizado en los ejemplos 11.4, 11.5 y 11.9. Las cantidades 
necesarias son: 


Feza Beni 1,-%2 hega p3 
C.M. ERROR = 6.99, con 12 grados de libertad. 


e 
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4 


Para hacer las M 6 comparaciones de dos medias supongamos de nuevo que se quiere mantener un nivel de 


significancia œ = 0.06 para las 6 comparaciones. De la tabla de ż obtenemos tọ 005(12)= 3.055. De acuerdo 
con (11.50), los intervalos de confianza para T, —T, se obtienen mediante: 


eE 2C.M.E. 
Y, To, +1 (GLOME) M 


En este punto conviene hacer la siguiente observación: en la ecuación anterior la cantidad después del signo + 
es idéntica para cualquier par de tratamientos 7,7’ y, por tanto, un intervalo cualquiera no cubrirá a cero (los 
dos tratamientos serán distintos con nivel æ de significancia) si: 


me 2C.M.E. 
|7. —F,. [E tan (GLOME) ZE 


por lo que basta calcular el valor en el lado derecho de la desigualdad anterior para comparar todos los pares de 


tratamientos. En este caso: 
[2C.M.E. [2 6. 
tajo (G.L.C.M.E) > = 3.055 zem = 5.108 


valor contra el cual comparamos las 6 diferencias de medias en la siguiente tabla. 


Tety IZ.- 7, 
T¡ —T) 10.0 > 5.108* 
Ti 7.0 > 5:108" 
ty Ta 1.6 < 5.108* 
T, — Ty 17.0 > 5.108* 
trt 8.4 > 5.108* 
T3 — T4 8.6 > 5.108* 


* Tratamientos con efectos distintos con « = 0.06. 


De la tabla anterior se concluye que, con 4 = 0.06, los únicos tratamientos con efectos iguales son el 1 y el 4, 
es decir, los dos recubrimientos de cromo. 4 


La forma de comparar un grupo de tratamientos que se derivó en el ejemplo 11.11 puede aplicarse siempre 
que todos los tratamientos tengan el mismo número de repeticiones, por lo que se destaca en el siguiente 
recuadro. 


„g 
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La expresión (11.51), sólo que con 1,,,, en vez de taj21» es la más antigua en comparaciones múltiples. A la 


[2C.M.E. 
cantidad t4; (G.L.C.M.E.) ps acostumbra llamarla Diferencia Minima Significativa (D.M.S.) porque 


es el mínimo por el cual deben diferir dos medias para ser declaradas de poblaciones distintas. Como ya hemos 
señalado, es más conveniente usar 2,,,,,, y a la cantidad resultante le llamamos una D.M.S. corregida. 
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Apéndice A. 
Prueba de Bartlett para homogeneidad de Varianzas 


En las técnicas del capítulo 11 se ha insistido en la importancia de que las poblaciones cuyas medias se van a 
comparar tengan la misma varianza. En éstas y en otras situaciones es importante disponer de una prueba que 
nos permita comparar las varianzas de un número arbitrario de poblaciones, ya que el método de la sección 
10.6 sólo es aplicable cuando se tienen dos de ellas. Existen en la literatura estadística varias pruebas para este 
propósito, pero la más utilizada es la llamada Prueba de Bartlett, la cual se describe y ejemplifica en este apéndice. 


Presentamos primero la estructura de los datos para la prueba. 


La hipótesis que se desea probar es que las ż poblaciones Normales tienen una varianza común (a? ); es decir, 
que si las varianzas poblacionales se representan por 0, 05,..., 0; , el juego de hipótesis a probar es: 


IS AS + AS 
Ho:0; =0} = =0; =0 


Ha : al menos una Ø? es diferente de las demás. 


La estadística que se usa para la prueba es: 


NS [os - Y 1,log S? 


i=l 


(11.A.2) 


t 
donde /= Y /, son los grados de libertad del estimador ponderado S ? definido en (11.A.1), log, denota el 


i=l 


logaritmo natural y: 


sr 1 
aa dl a- 
e l z| 


(11.A.3) 
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A 
Si se prefiere usar logaritmos base 10, la expresión para X6 es: 


2.3026 3 
X0 e log, pS? — Y, 1,108, 0 5 
i=l 


(11.A.4) 


Bartlett (referencia 11.A.1) ha mostrado que, cuando Ho es cierta, Xo tiene una distribución que es 
aproximadamente May: La regla de decisión para la prueba es entonces: Rechazar Ho si xo > x¿(1—1). 
Enseguida se ilustra la forma de hacer la prueba, utilizando los datos del DCA del ejemplo 11.3. 


Ejemplo 11.A.1. En el ejemplo 11.3 se analizó un DCA con los datos que se muestran en la siguiente tabla. Los 

2 . , . . £ . 
valores $; se obtuvieron para la tabla de A de V, pero aquí se pide al lector que los verifique por cálculo directo 
en cada una de las muestras. Los grados de libertad son simplemente el número de observaciones en una muestra 
menos uno. 


Tratamientos 
1 2 3 4 
63 60 99 70 
68 65 66 69 
71 61 58 62 
70 59 71 
69 70 


5 9.7 7.0 13.67 116 


2 2. 
Con estos datos formamos una tabla de cálculos para obtener %6. 


Si l; US; log, Ss; l; log, S 1/4, 

9.7 4 38.80 2.272 9.088 0.250 

7.0 2 14.00 1.946 3.892 0.500 
13.67 3 41.01 2.615 7.845 0.333 
11.6 5 58.00 2.451 12.255 0.200 


y [= 14 151.81 33.080 1.283 


De aquí es fácil obtener: 
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C=1+ (1283 7)=1:1346 
14 


1 
3(4-1) 
Ilog S? = (14)l0g,(10.84) = (14)(2.383) = 33.362 


Sustituyendo en 11.A.2 obtenemos: 


T 2 a 362 — 33.080) = 0.2485 
Xo 711346 ` ` 


2 r 

Comparando este valor con Xa (3) vemos que habría que tomar un & cercana a 1 para rechazar Ho, por lo que la 
conclusión es que, dada la información en las muestras, no hay razón para creer que las varianzas poblacionales 
son distintas. 4 
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Ejercicios 


11.1. En un experimento realizado con el propósito de estudiar el efecto de las radiaciones sobre los 
linfocitos en la sangre de conejos se aplicó una dosis de 800 róentgen a cada una de las muestras de 
sangre de siete animales. Se registró el número de linfocitos antes y 24 horas después de la aplicación. 
Enseguida se reportan los porcentajes de linfocitos sobrevivientes en cada muestra (Fuente: Science, 
Vol. 110, pág. 44, Julio 8 de 1949): 


2.87, 10.73, 9.46, 7.68, 11.48, 5.28, 9.22 


a) Pruebe, usando la técnica del A de V, la hipótesis de que la media de linfocitos sobrevivientes es 
de 10%. Use a = 0.10. 


b) Pruebe, mediante la estadística t}, la misma hipótesis que en a). 


c) Verifique que a=ñ y que E ing = {toos OF 


11.2. En el modelo Y, =u+e,, (¿=1,...,n), uno de los problemas es estimar 4. En este modelo 
e; = Y, — u. Uno de los criterios usados para estimar 4 es encontrar 4 (estimador de u) que 
minimice: 


Al estimador 4 que minimiza Ql(í) se le llama el estimador de mínimos cuadrados de u, y es el 
estimador que minimiza la suma de cuadrados de los errores. 


a) Suponga que en un experimento se han obtenido las siguientes observaciones: 


- 


Yi: 2 —3, 4, 1, —1,5,6 


1 


Evalúe Ql(í) para 4 = —1, 0, 1, 1.5, 2, 2.5, 3, 4, 5 


b) Grafíque Q ( a) para los valores de 4 del inciso a) y deduzca, del comportamiento de la función, 


que el mínimo de Qla) ocurre para 1 = 2. Note que Y = Q =2. 


c) El resultado obtenido en b) es cierto en general. El estimador de mínimos cuadrados de n es Y. 
Es decir, que Y es el valor de 4 que minimiza: 


Pruebe que Ql(í) es un mínimo para A 


1%. 
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11.4. 


LA 


11.6. 


En el ejercicio 11.1 se analizaron los resultados obtenidos con una dosis de 800 róentgen sobre el 
porcentaje de linfocitos sobrevivientes 24 horas después de la aplicación. En el mismo experimento, 
a otras cuatro muestras se les aplicó una dosis de 1000 róentgen y se midió la misma variable que en 
11.1. Los resultados son: 


800 róentgen: 2.87, 10.73, 9.46, 7.68, 11.48, 5.28, 9:72. 
1 000 röentgen: 436. 12.31, 6.85, 2.72. 


Sean: 

Yip Yiz Yiz fig Yis» Yio» Yi7 las variables en el tratamiento de 800 r, y Y>1, Ya», Y23» Ys las del de 
1000 r. Suponga que las muestras son aleatorias e independientes. 

a) Presente la tabla de A de V y pruebe la hipótesis pertinente. (a = 0.05). 

b) Pruebe la misma hipótesis que en 4) usando una prueba de ż. (a = 0.05). 

En el siguiente experimento se compararon los tiempos de coagulación de la sangre en cuatro grupos 


de ardillas con diferentes niveles de protrombina (un componente del plasma, necesario para la 
formación de coágulos). En los tratamientos, 100% es la sangre normal. 


Tiempos de coagulación (en segundos) 
Niveles de protrombina 


20% 30% 50% 100% 
34.4 25.0 20.9 19.7 

213 23.2 22.2 21.7 

65.0 45.2 27.8 21.1 

JEJ 26.4 19.6 18.5 

48.5 26.8 20.1 16.0 
38.4 32.7 22.1 20.2 
40.5 28.8 19.7 


n =7 m=7 n=7 n¿=6 


Presente la tabla de A de Vy pruebe la hipótesis de igualdad de tratamientos. (Use a = 0.05). Calcule 
las varianzas individuales dentro de los tratamientos y verifique con ellas su cálculo del cuadrado 
medio del error. ¿Parece sostenible la suposición de homogeneidad de varianzas? 


En un diagrama de puntos represente las 27 observaciones del ejercicio 1 1.4, usando diferentes símbolos 
para cada uno de los cuatro tratamientos. Comente sobre la disposición de los puntos en relación con 
la suposición de normalidad. ¿Parecen iguales las varianzas? ¿Cómo afecta esto a las conclusiones? 

¿ ¿ 


Use la prueba de Bartlett (Apéndice 11-A) para probar igualdad de varianzas en los tratamientos del 
ejercicio 11.4 (a = 0.05). ¿Es totalmente confiable la prueba en este caso? 
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11.7. Verifique el último paso en la obtención de la igualdad (11.23), es decir, pruebe que en un DCA: 


YI (1, Y. )(%,. -Y.)=0 


11.8. Verifique las ecuaciones de cálculo de las sumas de cuadrados en un DCA. [Ecuaciones (11.31), 
(11.32) y (11.33)]. Es decir, pruebe que: 


t e cd fl t y? y* 
b) Y. =F A jo. Lo 
21 2 ni Xn, 
t n 2 t n n t E 
c) Za (Y, -Y..) = 2, Ge à 


11.9. Los datos que se presentan enseguida son rendimientos en toneladas por hectárea de un pasto (Rye 
grass) con 3 niveles de fertilización nitrogenada. El diseño fue completamente aleatorizado, con 5 
repeticiones por tratamiento. 


Tratamientos (niveles de nitrógeno) 


N N, N; 
(Rendimiento. Ton X Ha) 
14.823 25.151 32.605 
14.676 25.401 32.460 
14.720 25.131 32.256 
14.514 25.031 32.669 
15.065 25.267 32.111 


Presente la tabla de A de V y pruebe la hipótesis de igualdad de tratamientos. Use œ = 0.01. ¿Hay 
alguna suposición del A de V que parezca no cumplirse? 


11.10. En un experimento se compararon los efectos de 4 tratamientos sobre el rendimiento de una 
variedad (Gila) de cártamo. Los tratamientos son de dos tipos: humedad aprovechable al momento 
del riego de auxilio (H) y fertilización nitrogenada (N). Este tipo de experimento, en que se prueban 
simultáneamente dos (o más) tipos de tratamientos, reciben el nombre de factoriales. Aquí se tienen 
dos factores: humedad aprovechable y nitrógeno. En este caso los riegos de auxilio se dieron con 30 
y 70% de humedad aprovechable, y se aplicaron dos dosis de nitrógeno (0 y 100 kgX Ha). Decimos 
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entonces que tenemos dos niveles de cada uno de los dos factores o que tenemos un factorial 2X2. 
Tenemos entonces: 


Factores Niveles 
Humedad aprovechable A,(30%), H,(70%) 
Nitrógeno N;(0), N,(100) 


Los cuatro tratamientos son A,N,, A,N), H,N,, H, Nh. El experimento se realizó en un DCA con 
4 repeticiones por tratamiento, y los resultados se presentan en seguida. 


Rendimiento de cártamo en TonX Ha 


Tratamiento 


HN, HN, HN, HN, 
0.5 1.5 2.4 1.6 
1.4 3.0 3.4 1.5 
2.0 2.4 3.3 3.2 
0.5 1.9 2.1 1.7 


Presente la tabla de A de V y pruebe la hipótesis de igualdad de tratamientos. (Use a = 0.05). 

En un experimento para estudiar la acción de dos compuestos sobre una espiroqueta (Borrelia 
duttoni) se probaron 4 tratamientos: 

l: testigo 

2: 5 mg/kg de óxido de arsénico. 

3: 4 mg/kg de aureomicina. 

4: 5 mg/kg de óxido de arsénico + 4 mg/kg de aureomicina. 

Los tratamientos se aplicaron a ratones infectados con las dosis descritas arriba. El tratamiento 
testigo consiste en no tratar a los animales. El diseño fue completamente aleatorizado y la variable 


de respuesta fue la proporción de espiroquetas sobrevivientes 3 horas después de la aplicación en 25 
campos oscuros. 


Tratamiento 


l 2 E: 4 
3.2 1.5 0.8 1.5 
2.5 1.1 0.1 1.4 
2.8 1.7 0.4 0.9 
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Presente la tabla de A de V y pruebe la hipótesis de igualdad de tratamientos. (Use æ = 0.01). 
11.12. En un experimento realizado en el cultivo de soya se ensayaron varios niveles de humedad 


aprovechable y varios niveles de fósforo. En este ejercicio sólo usaremos parte de los datos. Los 
tratamientos son: 


1. (4,P,) : 20% de humedad y 30 kg/ha de fósforo. 


N 


. (HP) : 40% de humedad y 30 kg/ha de fósforo. 


DD 


. (4,P,) : 20% de humedad y 60 kg/ha de fósforo. 
4. (H,P,): 40% de humedad y 60 kg/ha de fósforo. 
El experimento se realizó en un DBAC con 6 repeticiones. Los bloques fueron franjas de terreno 


relativamente uniformes. Las unidades experimentales (4 por bloque) fueron rectángulos de 28 m?, 
y la variable medida fue el rendimiento de grano (en kg) por unidad experimental. 


Tratamiento 


Bloque 1 2 3 4 
I 73 6.8 6.7 S7 
II 7.2 559 73 6.9 
IM 7.6 6.8 6.8 6.4 
IV 7.2 6.5 7.4 6.1 
V TS 6.8 7.5 6.4 
VI 7.6 7.1 6.3 6.3 


Presente la tabla de A de Vy pruebe la hipótesis de igualdad de tratamientos. (Use a = 0.05). 


11.13. Una cadena de supermercados está considerando tres posibles tipos de obsequio por volumen de 
compra para incrementar sus ventas. El primero estaría dirigido a los niños (N), el segundo a las 
madres (M) y el tercero a los padres (P). Antes de decidir cuál de los tres tipos le conviene, el gerente 
de publicidad decide realizar un experimento. De las ciudades donde la compañía tiene negocios, 
elige cinco que considera representativas, y en las cuales tiene tres o más supermercados. En cada 
ciudad elige tres supermercados al azar y, también aleatoriamente, decide cuál negocio va a ofrecer 
cada uno de los tipos de obsequio. Lleva a cabo las diferentes promociones durante una semana y, en 
cada uno de los 15 casos, registra el incremento semanal en ventas con respecto a la semana anterior 
en el mismo negocio. Los resultados se resumen en seguida. 
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Incremento semanal en ventas 
(Decenas de miles de pesos) 


Bloque Tratamiento 

(ciudad) N M P 
1 10.1 9.2 4.9 
2 8.9 9.3 5.2 
3 2.6 34 1.9 
4 7.4 6.0 5.4 
5 0.8 1.2 0.1 


Presente la tabla de A de Vy pruebe la hipótesis de igualdad de tratamientos. (Use a = 0.01). 


Considere el diseño experimental descrito en el ejercicio 11.13, partiendo de que se van a comparar 
3 tratamientos con 5 repeticiones por tratamiento. 


a) Suponga que se eligen 15 supermercados al azar, sin tomar en cuenta la ciudad en que están 
ubicados. ¿Cuál sería el diseño en este caso? ¿Qué ventajas y desventajas tiene en relación con el 
realizado? 


b) Considere la siguiente forma alternativa de definir los bloques: se eligen sólo 5 supermercados y 
en 3 semanas sucesivas se llevan a cabo las diferentes promociones en cada uno de ellos. ¿Cuál es 
la principal desventaja de este procedimiento? 


c) ¿Por qué es mejor usar como variable de respuesta el incremento en ventas con respecto a la 
semana anterior, en vez de las ventas en la semana de la promoción? 


Se quiere comparar cuatro modelos de calculadoras electrónicas por lo que toca a su eficiencia 
para realizar un análisis de varianza. Para ese fin se elige al azar 3 estudiantes del curso de métodos 
estadísticos, y a cada uno se le instruye sobre la forma óptima de usar cada modelo para el fin 
propuesto. Posteriormente, a cada uno de los tres se le pide que construya la tabla de A de V de los 
datos del ejercicio 11.13, con cada uno de los cuatro modelos, aleatorizando el orden en que usa cada 
modelo. En seguida se presentan los tiempos (en minutos) en cada intento. 


Bloque Tratamiento 
(alumno) M, M, M, M; 
1 13.8 12.6 14.7 15.3 
2 18.6 16.4 20.3 19.9 
3 19.2 15.8 20.6 21.4 


Presente la tabla de A de V y pruebe la hipótesis de que los cuatro modelos son iguales por lo que se 
refiere a su uso para construir la tabla de A de V. (æ = 0.01). 


11.18 


11.17. 


11.18. 


11,19, 
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Con respecto al ejercicio 11.15, note que en las 12 repeticiones del experimento se usó el mismo 
conjunto de datos, aleatorizando el orden en que cada estudiante usa cada tipo de máquina. 


a) ¿Qué problema generaría no aleatorizar el orden? 


b) ¿Sería conveniente usar más de un conjunto de datos? 


Se va a comparar dos catalizadores (c, y c, ) y tres velocidades de mezcla v, v, y v3 por lo que toca 
a su influencia sobre el porcentaje de ingrediente activo resultante en una reacción química. En la 
planta en que se va a realizar el experimento se tienen tres turnos de trabajo por día, y se ha observado 
que hay variaciones importantes de turno a turno. Por esa razón se decide usar cada turno como un 
bloque y repetir los seis tratamientos, (c Vi» CU), C1V3 > CU], 070), c,v3) en cada uno de los bloques. 
Los resultados se presentan enseguida. 


Bloque Tratamiento 

(turno) c10] GLA c103 CW) C33 0703 
1 38.4 40.3 29.4 32.9 48.6 46.5 
2 35.6 39.8 27.3 34.9 43.7 41.6 
3 30.3 30.6 28.2 30.8 49.2 39.7 


Presente la tabla de A de Vy pruebe la hipótesis de igualdad entre los tratamientos (a = 0.05). 


Una empresa que administra cuatro hoteles quiere comparar la calidad del servicio que se da en 
ellos. Para ese fin, comisiona a cuatro personas para que (sin que sea del conocimiento del personal) 
califiquen la atención que cada hotel proporciona. Cada persona pasará un día en cada hotel y, por 
la evaluación de ciertas características del servicio (las mismas para cada individuo, de acuerdo con 
instrucciones precisas de empresa), otorgará una calificación a cada hotel. Los resultados son (la 
escala es de 1 a 10): 


Persona Eia 
A B € D 
1 7.6 7.8 9.0 8.3 
2 6.2 79 8.7 7.6 
3 5.4 6.7 9.3 7.6 
4 7.7 8.3 9.6 8.4 


Con estos datos, ¿hay evidencia para creer que la calidad de atención es diferente? (a = 0.05). 


En el ejercicio 11.18, ¿sería mejor que para un hotel dado los cuatro jueces calificaran el mismo día, 
J ¿ jor que p J 

o días diferentes? ¿Qué ventaja tiene usar bloques? Hay un problema serio para el análisis de esta 

información con la técnica convencional de A de V, ¿cuál es? 
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En el ejercicio 11.9 se presentaron los resultados de un DCA con cinco repeticiones, comparando tres 
niveles de fertilización en un pasto. Las medias son (en ton/Ha): 


14.76 25.20 32.42 


El CME es 0.039, con 12 g.l. 


a) Mediante un contraste pruebe la hipótesis de que 4 y, = My,» Contra la alternativa de que son 
distintas («4 = 0.01). 


b) Pruebe que Uy, — My, >17 cona = 0.01. Interprete el resultado. 


c) Construya un intervalo de confianza al 99% para Uy, TMN, Compare el resultado con el 
obtenido en a). i 


En el ejercicio 11.10 se analizó un experimento en un DCA con cuatro repeticiones por tratamiento. 
El experimento tiene dos tipos de tratamientos (factores): humedad aprovechable (H) y fertilización 
nitrogenada (N), cada uno a dos niveles. Tenemos un factorial 2X2. Los tratamientos, medias y 
C.M.E. son: 


Tratamientos: AN,¡() HA,N,(2) HN, (3) H,N(4) 
Medias: 1.1 2.2 2.8 2.0 
n;: 4 = 4 A 


1 


C.M.E. = 0.507, con 12 g.l. 


a) Considere el contraste Q) =74+T3—T2 7T]. Note que Q, mide el efecto de humedad 
aprovechable. Pruebe Ho: Q, =0 en oposición a Ha: Q, #0 . (a = 0.05). 


b) Sea Q, =T, +T4—73—T1. Q, mide el efecto de nitrógeno. Pruebe Ho: Q, =0 en oposición a 
Ha:Q, #0. (a = 0.05). 


c) Sea =T4 +T; 7,7 T3. Aunque esto es más difícil de apreciar, mide la interacción 
1 2743 q P 


entre humedad aprovechable y nitrógeno. Pruebe Ho:Q,=0 en oposición a Ha : Q; #0. 
(a = 0.05). 


(Contrastes ortogonales). Si en un experimento se tienen ż tratamientos, todos con el mismo número 
de repeticiones, y se definen dos contrastes: 


t 
Q = E ar; 
i=] 


11.23, 
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t 


Q: = br, 


i=l 


Diremos que Q, y Q; son ortogonales si by a;b; = 0. Por ejemplo, con £ = 3: 


i=l 


Q|=7,—7) 


3 
son ortogonales, ya que 4 =1, 4, =—1,4,=0,4 =1, b, =1,b, =-—2, por lo que Y a,b, =0 


i=l 


Verifique en el ejercicio 11.21 que Q, es ortogonal a Q, y a Qy; y que Q, es ortogonal a Q}. Decimos 
entonces que los 3 contrastes son ortogonales. 


t t 
(Suma de cuadrados de un contraste). Sea Q = E c;T; un contraste, y sea su estimador Q = DA Y. 


i=l i= 


Para probar: 
Ho:Q =0 en oposición a Ha :Q #0 


usamos la estadística: 


Si Ho es cierta, tọ ~t (g.l. C.M.E.), por lo que ż ~ F ICME Nótese que: 


a2 
2 Q R 


t =— = = 


2 
CHES 
n. 


1 


Si todos los tratamientos tienen el mismo número de repeticiones: m = m =+ =n, =r. 


A = rQ 
” CME e? 


por lo que: 
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== ME 


Para probar el juego de hipótesis Ho : Q = 0 en oposición a Ha : Q # 0 puede usarse indistintamente 
Fy 0 to- 


Si se usa F) al numerador: 


se le llama la Suma de cuadrados del contraste Q. 
a) En el ejercicio 11.21 calcule las sumas de cuadrados de los contrastes Q}, Q2 y Q3- 


b) Verifique, del A de V en el ejercicio 11.10, que SE (G) + S.C. (QU) + S.C. (Q3) 
= S.C. TRATAMIENTOS. Esto es cierto en general. Si se tienen t tratamientos, pueden 
formularse t — 1 contrastes ortogonales, y la suma de sus sumas de cuadrados es igual a la S.C. 
TRATAMIENTOS. Es decir, que £ — 1 contrastes ortogonales dan origen a una partición de 
la suma de cuadrados de tratamientos en + — 1 sumas de cuadrados, cada una con 1 g. l. 


11.24. En el experimento del ejercicio 11.11 se estudió la acción de dos compuestos sobre una espiroqueta. 
También se combinaron los dos para estudiar la interacción, y se usó un testigo como cuarto 
tratamiento. Las medias por tratamiento y el C.M.E. del experimento se presentan en seguida. Las 
medias son proporciones de espiroquetas supervivientes. 


Tratamiento 
1 (Testigo) 2(Arsénico) 3(Aureomicina) 4(Arsénico + Aureomicina) 
Media 2.83 1.43 0.43 1.27 


C.M.E. = 0.111, con 8 g.l. 
n =m =m =n =3 


Mediante contrastes haga las siguientes comparaciones: 
a) Arsénico en oposición a Testigo. 

b) Aureomicina en oposición a Testigo. 

c) Arsénico + Aureomicina en oposición a Testigo. 


d) Arsénico en oposición a Aureomicina. 


11,25, 


11.26. 
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e) Arsénico en oposición a Arsénico + Aureomicina. 

f) Aureomicina en oposición a Arsénico + Aureomicina. 

Use a = 0.05 en todos los casos. Interprete los resultados. 

En el ejercicio 11.24 se hicieron pruebas de hipótesis para 6 contrastes en un DCA con 4 tratamientos. 
Esos 6 contrastes no son independientes (ortogonales), dado que con 4 tratamientos sólo pueden 
hacerse 3 comparaciones independientes, las que corresponden a,los 3 g./. que se tienen para 


tratamientos. Considere los contrastes: 

Q) =h +T¿—T, —T) 

Q; =T; +T -T2 -T3 

a) Verifique que los tres contrastes son ortogonales (ver definición en el ejercicio 11.22). 


b) Calcule la suma de cuadrados de cada contraste (ver ejercicio 11.23). 


S.C. 


c) Verifique que (salvo errores de redondeo) S.C. (Q) + S.C. (Q,) + S.C. (Q3) 
TRATS. 


(Interacción entre dos tratamientos). En el ejercicio 11.25 los contrastes Q}, Q, y Q; tienen la siguiente 
interpretación: 


Q; = (7, —7,)+(7,—r,) es el efecto del arsénico comparado con el testigo, más el efecto del 
arsénico comparado con la aureomicina, o sea que Q, es el efecto total del arsénico. 


Q, = (7, —7,)+(T,—r,) es el efecto de la aureomicina comparada con el testigo, más el efecto de 
la aureomicina comparada con el arsénico; es decir, Q, es el efecto total de la aureomicina. 


Q; =(7,4—7,)-(7,—7,)=(7,—7,)-(r,—7,) es la diferencia entre los dos efectos de 
aureomicina (con arsénico y sin arsénico), y también es la diferencia entre los dos efectos de arsénico 
(con y sin aureomicina). Q} es entonces una medida de la interacción entre la aureomicina y el 
arsénico. El experimento que nos está sirviendo para esta serie de ejercicios (11.11, 11.24, 11.25, 
11.26 y 11.27) fue reportado en Science, Vol. 116, pág. 579, 28 de nov. de 1952, aunque aquí se ha 
usado un subconjunto modificado de los datos. El principal objetivo del experimento era mostrar 
que existe interferencia (es decir, interacción negativa) entre el arsénico y la aureomicina. 


a) Pruebe que existe interferencia, es decir, pruebe Ho:Q,<0 en oposición a 
Ha : Q; >0,(a=0.01). Represente gráficamente la interacción usando las medias de cada 


tratamiento. 


b) ¿Cuál sería el mejor tratamiento de los 4 ensayados? 
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a 


11:27; 


11.28. 


11.29, 


Con los datos del ejercicio 11.11 repita las seis comparaciones posibles de pares de medias hechas en 
el ejercicio 11.24, pero ahora use la técnica de la diferencia mínima significativa modificada. Mantenga 
un nivel de significancia aproximado del 5% para el conjunto de las seis comparaciones. Compare 
sus resultados con los obtenidos en 11.24. 


En el ejercicio 11.12 se presentaron los resultados de un experimento en un DBAC con á tratamientos. 
Los tratamientos son dos niveles de humedad aprovechable (H, = 20% y H, = 40%), combinados 
con dos niveles de fósforo (P, = kg/ha y P, = kg/ha). En seguida se presentan algunos resultados. 


(1) (2) (3) (4) 
Tratamientos HP, HP, HP, HL, 
Medias (kg/unidad experimental) 7.4 6.6 7.0 6.3 


Se hicieron 6 repeticiones por tratamiento y el C.M.E. fue 0.216, con 15 gol. 


a) Sea Qi =T¿ +73 —T,—T,. Q; refleja el efecto de humedad aprovechable. Decida qué nivel de 
humedad aprovechable es mejor. (4 = 0.05). 


b) Sea Q, =T¿+T,—T,—T,. Q, mide el efecto del fósforo. ¿Qué nivel de fertilización es mejor? 
(a = 0.05). 


c) Sea Q3 =T; HT] -T Th. Q, mide la interacción (ver ejercicio 11.26) entre humedad 
aprovechable y fósforo, ¿Es significativa la interacción? (æ = 0.05). 


d) Calcule las S.C. de Q}, Q, y Q; (ver ejercicio 11.23) y verifique que S.C. (Q,) + S.C. (Q,) 
+ S.C. (Q3) = S.C. TRATS. ¿Por qué? 


c) ¿Qué proporción de la suma de cuadrados de tratamientos es explicada por Q,? Relacione esto 


con los resultados en 4), b) y c). 


En el ejercicio 11.13 se compararon tres promociones diferentes en supermercados usando un DBAC 
con 5 repeticiones. Las medias de tratamientos fueron: 


Tratamiento 1 (Niños) 2(Madres) 3(Padres) 
Media 5.96 5.76 3.50 


El C.M.E. es 1.31, con 8 g.l. 
a) Mediante un contraste compare los tratamientos 1 y3.a = 0.01. 


b) Utilizando la técnica de la diferencia mínima significativa modificada compare todas las medias, 
de dos en dos. Mantenga un nivel global de significancia del 1%. 


c) ¿ Hay contradicción entre el resultado del A de V (ejercicio 11.13) y el del inciso 2), o entre éste 
y el del inciso b)? 
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11.30. En el ejercicio 11.15, de las cuatro calculadoras comparadas suponga que M, tiene un costo mayor 
que las otras. 


a) Mediante un contraste compare M, con los otros tres tratamientos. 


b) Encuentre dos contrastes ortogonales al propuesto en a) y verifique que la suma de las sumas de 
cuadrados de los tres contrastes ortogonales es igual a la S.C. TRAT. ¿Qué porcentaje de la S.C. 
TRAT. representa el contraste en 4)? Para definiciones ver ejercicios 11.22 y 11.23. 


11.31. En el ejercicio 11.17 se analizó un experimento en un DBAC, con seis tratamientos y tres repeticiones. 
Los tratamientos consisten en las combinaciones de dos catalizadores y tres velocidades de mezcla en 
una reacción química. La variable respuesta es el porcentaje de ingrediente activo en la reacción (se 
dice en este caso que el experimento es un factorial 2X 3 en bloques completos). En seguida se resumen 
algunos resultados del experimento. 


Tratamiento C, V; GV Ci V3 CV; GV GV3 
(1) (2) (3) (4) (5) (6) 
Media 34.8 36.9 28.3 32.9 47.2 42.6 


El C.M.E. es 6.48, con 10 g.l. 
a) Considere el contraste: 


Q, =T4 +T; +71, 7,75 =(7¿—7,)+(7,—7,)+(r4 —7,). 


Q; es el efecto total del catalizador 2, comparado con el catalizador 1. Pruebe Ho:Q,=0 en 
oposición a Ha : Q, #0. æ = 0.01. 


b) Suponga que se quieren comparar todas las medias de dos en dos. Calcule la distancia mínima 
necesaria entre dos medias para que sean declaradas distintas con Y = 0.05, usando la diferencia 
mínima significativa modificada. 


c) Use la distancia calculada en $) para decidir cuáles de las 15 posibles comparaciones entre las 6 
medias son diferentes de cero. 


d) ¿Parece razonable realizar 15 comparaciones entre medias cuando sólo se tienen 5 g./. para 
tratamientos? ¿Cuál es el precio que se paga con el método de la diferencia mínima significativa 
modificada? 


EN T 2 


Regresión lineal simple 


12.1. Introducción 


Desde los primeros capítulos de este libro hemos discutido la relación entre dos variables. Así, en la sección 
3.6 se estudiaron dos medidas de asociación: la Covarianza y el Coeficiente de Correlación. Posteriormente, en 
la sección 5.8, se estudiaron los homólogos de estas medidas descriptivas en el caso de la distribución teórica 
conjunta de dos variables aleatorias. En este capítulo profundizaremos en nuestro análisis de la relación entre 
dos variables, análisis que es de capital importancia cuando los valores de una variable se modifican de acuerdo 


con los de otra que puede ser manipulada por nosotros. 


Con los métodos de este capítulo se pretende ir más allá de medir el grado de asociación entre dos variables. 
Concretamente se trata de investigar la naturaleza de la relación y construir modelos que la describan, 
fundamentalmente con el propósito de predecir el comportamiento de una de ellas a partir de valores de la otra, 
aunque en general podemos decir que el objetivo global es hacer mejores inferencias sobre la variable que nos 


interesa primordialmente. 


El conjunto de técnicas que utilizaremos para construir y evaluar modelos que describen la relación entre 
variables, y para formular inferencias basadas en los modelos obtenidos se conocen colectivamente como Técnicas 
de Regresión, y al análisis estadístico que resulta de aplicarlas se le denomina Análisis de Regresión. 


En general, el análisis de regresión permite estudiar la influencia de una o más variables, que llamamos 
independientes, sobre otra que llamamos dependiente. Si se incluyen dos o más variables independientes se tiene 
un modelo de Regresión Múltiple. Dada la naturaleza elemental de este texto nos limitaremos al caso particular 
de una sola variable independiente, por lo que únicamente estudiaremos modelos de Regresión Simple. Una 
restricción final es que entre todos los posibles tipos de modelo que pueden describir la relación entre dos 
variables consideraremos exclusivamente los modelos llamados lineales y, por tanto, nos concretaremos al 
estudio de la Regresión Lineal Simple. Aunque pueda parecer que nos hemos impuesto un número muy grande 
de restricciones, los métodos que describiremos en seguida son de mucha utilidad, como esperamos sea evidente 
al final de la presentación. A los lectores interesados en un estudio más a fondo del análisis de regresión se les 


cla 


recomienda la lectura de la referencia 12.1. 
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12.2. Usos de la regresión lineal simple 


Puede decirse que las situaciones prácticas en que es importante investigar la naturaleza de la relación entre 
dos variables pertenecen a todos los aspectos del quehacer humano. Así, por ejemplo, los administradores de 
sistemas universitarios están interesados en evaluar la relación entre las calificaciones obtenidas por los aspirantes 
en los exámenes de admisión y las calificaciones que aquéllos obtienen como alumnos. Para un agrónomo es 
muy importante la relación entre el número de plantas por hectárea en un cultivo y el rendimiento de éste. La 
dependencia entre las cantidades gastadas en la publicidad de un producto y las ventas del mismo es preocupación 
fundamental de los gerentes de ventas. La estrecha asociación entre el peso y la presión arterial de una persona 
es importante en medicina. El grado de participación política de un individuo y su nivel de educación aparecen 
frecuentemente relacionados. Y podríamos continuar citando ejemplos, pero los anteriores ilustran ampliamente 
el espacio de aplicación del análisis de regresión y los problemas de interpretación asociados con él. Por un lado, 
es claro que no siempre es evidente cuál de las variables debe ser considerada como dependiente y cuál como 
independiente, dado que para una mentalidad moderna la idea de dependencia corresponde a la de causalidad, 
y por otra parte la identificación de una variable independiente y una dependiente es un requisito fundamental 
para realizar un análisis de regresión. Por lo pronto nos dedicaremos a describir el análisis de regresión lineal 
simple a partir del supuesto de que se han identificado las variables dependiente e independiente. En una 
sección posterior nos referiremos al problema lógico de la causalidad. Antes de pasar a la descripción de los 
métodos presentamos tres ejemplos concretos en que las técnicas de regresión son de utilidad. 


Ejemplo 12.1. En el capítulo 3 se utilizaron varias veces las observaciones resultantes de medir el peso y la 
estatura de cada uno de diez individuos. Allí, los pesos se asocian a la variable X y las estaturas a la variable Y. 
Enseguida se reproducen los datos. 


Peso (X) 63 52 78 49 71 62 68 48 56 67 
Estatura (Y) 162 158 167 151 162 168 167 153 152 173 


Las estadísticas descriptivas se obtuvieron en el capítulo 3. En especial, el coeficiente de correlación es 
ryy =0.772. La gráfica de dispersión se presenta en la Figura 12.1. 


Si un investigador desea encontrar la relación funcional entre estas variables, con objeto de describir el 
comportamiento de las alturas usando los pesos (o viceversa), el análisis de regresión puede serle de utilidad. 4 


Ejemplo 12.2. En el ejemplo 3.24 se calculó el coeficiente de correlación para los siguientes datos: X representa 
la porción de humedad consumida al momento del riego y Y las pérdidas esperadas en rendimiento de soya. 


X 0.00 0.10 0.20 0.30 0.40 0.50 0.58 
Y 4593.00 3141.60 1965.20 1064.20 438.60 85.00 0.00 


Capítulo 12 
REGRESIÓN LINEAL SIMPLE 


Y 

180 Ê 

170 + 
g 8 é 
3 160 + 
PES; . 

150 E 

xX 
40 50 60 70 80 


Pesos 


Figura 12.1. Diagrama de dispersión de diez pesos y estaturas. 


El valor obtenido para ryy es —0.9609, y el diagrama de dispersión se presenta en la Figura 12.2. 
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Figura 12.2. Diagrama de dispersión de siete pares de datos. 


Dado el tipo de fenómeno bajo estudio, el análisis de regresión le permitirá al investigador encontrar un modelo 


para predecir las pérdidas esperadas para diferentes porciones de humedad consumida. 4 
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Ejemplo 12.3. El gerente de una cadena de supermercados desea investigar la relación entre el número de 
empleados y las ventas semanales. Para ello toma una muestra de 15 tiendas con características semejantes, 
obteniendo las siguientes observaciones. 


Tabla 12.1. Número de empleados y ventas semanales en cientos de miles de pesos en 15 supermercados 


Supermercado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
X 10 17 17 17 19 24 24 30 32 32 36 40 41 43 48 
je 4 6 6 5 5 8 12 12 11 13 15 16 16 17 20 


Algunas estadísticas importantes para estos datos son: 


X =28.6667, Sy =11.4372 


Y =11.3333, Sy = 4.8941 
rxy = 0.9719 


El diagrama de dispersión se presenta en la Figura 12.3. 


4 8 12 16 20 24 28 32 36 40 44 


Figura 12.3. Diagrama de dispersión de los datos de la Tabla 12.1. 


El interés del gerente está en predecir las ventas a partir del número de empleados contratados, con el propósito 
de determinar el número óptimo para maximizar las ventas. Esto puede lograrse mediante el análisis de 
regresión. ® 


En los ejemplos 12.2 y 12.3 resulta evidente cuál debe considerarse como variable dependiente y cuál como 
independiente; no así en el ejemplo 12.1, donde puede resultar igualmente interesante predecir las estaturas a 
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partir de los pesos o a la inversa. Sea cual fuere la situación, el investigador debe decidir de antemano, de acuerdo 
con la naturaleza de su problema, cuál variable será la dependiente en su análisis de regresión. 


12.3. El modelo de regresión lineal simple 


El primer paso en un análisis de regresión es elaborar el diagrama de dispersión de los datos, ya que éste puede 
ayudar en la búsqueda de un modelo que describa la relación entre la variable independiente (X) y la dependiente 
(Y). Concretamente la pregunta es: ¿cuál es la ecuación matemática apropiada para describir la relación entre 
X y Y? ¿Deberemos usar una función logarítmica? ¿Una línea recta? ¿Una parábola? Una vez decidida esta 
cuestión permanece el problema de encontrar las constantes que identifican a la ecuación en un caso específico 
y, posteriormente, el de interpretar la ecuación resultante. 


Para explicar las muy generales proposiciones anteriores, supóngase por un momento que decidimos que la 
relación entre X y Y puede modelarse con una línea recta, o sea que es de la forma: 


Y =P,+P,X (12.1) 


En la ecuación (12.1), Jọ es el valor de Y cuando X toma el valor cero, y recibe el nombre de ordenada al origen, 
mientras que $, es la pendiente de la recta, o sea el número de unidades que aumenta (o disminuye). Y por cada 
unidad que aumenta X. f, puede ser positiva o negativa (o cero) y entera o fraccionaria. Para identificar a un 
miembro específico de la familia representada por (12.1) es necesario asignar valores a fọ y B;. Así, por ejemplo, 
si By = 5 y Bo, = 2, la recta es: 


Y =5+2X 


y es fácil graficarla, ya que sólo se requiere calcular las coordenadas de dos puntos. Para X =1 obtenemos 
Y =5+2(1)=7, y para X =3 se tiene Y =5+2(3)=11. En la Figura 12.4 se grafican 3 rectas; una con 
pendiente positiva (Y =5+2X), una con pendiente negativa (Y =9.5—1.5X) y una con pendiente igual a 
cero (Y =8). 


Es claro entonces que, aun decidida la forma general de la relación, es necesario identificar las constantes en un 
caso particular. Pero antes de avanzar en esa dirección hay otra observación prioritaria. Una ecuación como la 
presentada en (12.1), si se usa para modelar la relación entre dos variables, implica que todas las observaciones 
(x, j Y,) de las variables deben localizarse sobre la gráfica de la función, de tal forma que para un valor dado de 
X el valor de Y está perfectamente determinado. Si éste es el caso decimos que la relación entre las variables es de 
tipo determinístico, y cuando eso ocurre lo usual es que las constantes de interés (como B, y £} en el modelo de 
línea recta) sean conocidas o al menos estén determinadas a grados de precisión tales que sus valores se pueden 
considerar conocidos para propósitos prácticos. Ejemplos de este tipo de relación son comunes en ciencias como 
la Física, pero aquí no nos ocuparemos de ellos. Por el contrario, en ejemplos como los aquí presentados (12.1, 
12.2 y 12.3) los puntos en los diagramas de dispersión no caen exactamente sobre una línea recta, sino más bien 
siguen una tendencia que podría representarse por una recta, con constantes $, y $8, desconocidas. El hecho de 
que en una muestra del par de variables (X, Y) las observaciones no se comporten exactamente de acuerdo con 
una relación determinística no debería sorprendernos, puesto que ya hemos discutido la variabilidad asociada 
con cualquier determinación experimental. Considérese como ilustración el ejemplo 12.2, e imagínense varias 
repeticiones para un mismo porcentaje de humedad consumida. Debido a las propiedades físicas y químicas del 
suelo, a variaciones de clima, a errores de medición, etc., puede esperarse que las diferentes experiencias arrojen 
distintos valores para Y, o sea la pérdida esperada por riego inoportuno. 
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Figura 12.4. Gráfica de tres rectas mostrando diferentes pendientes y ordenadas al origen. 


Por lo anterior, los modelos determinísticos son de utilidad limitada cuando se trata de representar las 
relaciones entre dos variables y al menos una de ellas se mide por intermedio de un experimento aleatorio. 
En este tipo de situaciones debemos recurrir a modelos estadísticos. El que propondremos sólo es una 
modificación del modelo lineal más simple discutido en el capítulo 11. El lector recordará que dicho modelo 
tiene por expresión: 


Y, =u+e,;1=1,2,...,n (12.2) 


donde Y, es la variable aleatoria observable, 4 es un parámetro desconocido y €; es una variable aleatoria no 
observable. 


La modificación que introducimos en el modelo (12.2) consiste en hacer explícito en el nuevo modelo que existe 
una dependencia entre los valores de las variables en cuestión, hecho que subrayamos escribiendo el modelo 
modificado como sigue: 


Y = +e.:i=1,2,...,n 
i = Myx, TE; (12.3) 


donde la diferencia con (12.2) consiste en que ahora no se tiene un parámetro único 4, sino que para un valor 
Y, el parámetro depende del valor X; asociado con él. De hecho, el símbolo 4y, y, , lo leemos como “la media de 
Y dado un valor fijo X; de X”. 


El modelo (12.3) meramente permite considerar una posible dependencia las variables, pero no especifica el 
tipo de relación existente. Esto se consigue proponiendo una expresión para Uy x- En seguida consideramos 
algunas, entre la infinidad de formas posibles: 
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My¡x = Po +P,X 
My ¡x = Bo + PisenX 
My ¡x = Bo +Ê, log X 
yx =By+B Xx? 
My¡x = Bo +exp(B,X) 
My ¡x = pa” 


Todos estos modelos son de regresión simple, puesto que sólo involucran a una variable independiente. En 
cambio, sólo los 4 primeros son lineales, mientras que los dos últimos son no-lineales. Por lineal entenderemos 
cualquier modelo en el cual 44y,, y es de la forma: 


Myix = Bo +R f(X) (12.4) 


donde f(X) es cualquier función de X. Nótese que el hecho de usar un modelo de regresión lineal simple de 
ninguna manera conlleva la suposición de que la relación entre Y y X puede representarse por una línea recta, 
aunque esto es cierto cuando Myy = fo +X . En los otros casos la relación de línea recta se da entre Y y 
una función de X. De cualquier modo, siempre que yy sea de la forma (12.4) diremos que el modelo es de 
Regresión Lineal Simple. Por otra parte, sea la ecuación de tipo lineal o no, a 4y,x se le llama la Ecuación de 
Regresión de Y sobre X. 


El modelo de línea recta 
Con el propósito de simplificar al máximo nuestra discusión estudiaremos el caso donde la relación entre Y y X 


puede modelarse mediante una línea recta. Posteriormente veremos que las técnicas son iguales siempre que el 
modelo sea de regresión lineal simple. Por lo pronto nos limitamos al caso en que 4y, y es de la forma: 


Uy ix =Bo+B,X 


y por lo tanto el modelo estadístico es: 


Y =P, +B X; +8, ¿=1,....n (12.5) 


El modelo (12.5) establece el marco conceptual del problema, y expresa simbólicamente, una relación lineal 
imperfecta entre las variables X y Y. En este caso a la recta My,x = Pp +f8,X se le conoce como Recta de 
Regresión. Dado que la relación no es determinística, trataremos de encontrar la recta que mejor represente la 
tendencia exhibida por los datos en cada caso, es decir encontraremos estimadores de $, y f} que nos permitan 
predecir con cierta confiabilidad el comportamiento de Ya partir de valores de X. Es necesario asentar que no 
se busca predecir valores individuales de Y, sino que, usando el modelo (12.5) se trata de estimar a 4y,y. El 
problema se especifica en el siguiente recuadro. 
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El lector debe notar que el modelo (12.5) no está completamente especificado, puesto que no se han establecido 
las suposiciones estadísticas necesarias para hacer inferencias basadas en él utilizando las técnicas desarrolladas 
en los capítulos precedentes. En seguida presentamos las suposiciones en un modelo de regresión lineal simple. 


Suposición 1. Y es una variable aleatoria cuya distribución probabilística depende de X 
Esto quiere decir que para cualquier valor de X, Yes una variable aleatoria con cierta distribución probabilística, 
con media Uy, y y varianza 07; y . Nótese que esta suposición solamente implica que Y es una variable aleatoria 


que depende de X, y no toma en cuenta la forma lineal de (12.5). La suposición se ilustra en la Figura 12.5. 


En la Figura 12.5 las diferentes distribuciones que corresponden a cada X; se dibujaron en las líneas inclinadas. 


F(/x) 


Ecuación de regresión 


xX 


Figura 12.5. Gráfica que ilustra el comportamiento de la variable aleatoria Y para diferentes valores de X. 


Suposición 2. Modelo de línea recta 


Esta suposición requiere que la ecuación para ly, y sea una línea recta, es decir, que yx = Po +f8,X y, por 
tanto, que la ecuación de dependencia sea Y = fB, + B,X +e. Con esta nueva restricción, la línea que une a 
ty ¡ x » debe ser una recta. Esta situación modificada se presenta en la Figura 12.6. 
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F(y!x) 


Recta de regresión: My, y = o +f,X 


Figura 12.6. Gráfica que ilustra la suposición de una línea recta entre las variables X y Y. 


Suposición 3. Homogeneidad de varianzas 


Tanto en la Figura 12.5 como en la 12.6 se han presentado distribuciones de Y de muy distintas formas. Sin 
embargo, una suposición muy importante en el análisis de regresión es que las varianzas de las distribuciones 


de Y'son idénticas para todos los valores de X. De otra forma, se supone que lx = Ot =.= te , donde 


o° es la varianza común (desconocida) para todas las distribuciones de Y, independientemente del valor de X. 
Nótese que esto equivale a suponer que la media de Y se modifica con el valor de X, pero la varianza se mantiene 
constante. 


Suposición 4. Independencia 


Los valores de Y deberán ser estadísticamente independientes. Un caso donde se viola drásticamente esta 
suposición es cuando, por ejemplo, se registra dos veces el peso de un individuo en un lapso menor de una hora. 
Otro ejemplo lo tenemos si medimos el grado de agresividad de dos hermanos viviendo en el mismo ambiente 
familiar. 


Suposición 5. Normalidad 


La distribución de Y para cualquier valor de X es Normal. Esto equivale a suponer que la variable aleatoria no 
observable e es normal, ya que X se toma como una variable no aleatoria susceptible de ser manipulada por el 
investigador. 


Todas estas suposiciones, consideradas conjuntamente, establecen el marco teórico en el que operaremos. Sólo 
resta añadir que, de acuerdo con nuestras discusiones previas sobre la naturaleza de los errores aleatorios, cabe 
suponer que la variable aleatoria no observable £ tiene media cero. Combinando todas las consideraciones 
anteriores podemos resumir el modelo de línea recta y sus suposiciones en el siguiente recuadro. 


p 
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Algunas de estas suposiciones se ilustran en la Figura 12.7. 


fix) 
Recta de regresión: My/y = Ĥo + fB,X 


A ğ $ X, 


Figura 12.7. Gráfica que muestra el modelo de línea recta con las suposiciones de 


homogeneidad de varianzas y distribución Normal. 
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12.4. Estimación de la recta de regresión por mínimos cuadrados 


El primer problema que atacaremos es el de estimar los parámetros $, y fB,, lo que equivale a estimar la 
recta de regresión 4y,y = PB, + B,X. Si denotamos a los estimadores por Ĥo y Ê, entonces nuestra recta 
estimada será Y = fB, + f$,X. Un método de estimación que a veces se utiliza en forma preliminar consiste 
en utilizar el diagrama de dispersión para dibujar la recta que mejor parezca representar la tendencia 
de los datos, o sea que es un método gráfico. Este método puede proporcionar resultados aceptables, 
sobre todo si la tendencia de los datos es muy marcada, pero tiene los inconvenientes de ser subjetivo, 
impreciso y sin ningún valor desde el punto de vista de la inferencia estadística. El método analítico más 
usado es el llamado Método de Mínimos Cuadrados y tiene algunos años de antigüedad, 

habiendo sido usado ya por Adrien Marie Legendre (1752- 

1833) y Carl Gauss (1777-1855). La idea del método f 


es producir estimadores Bo y Ê, que minimicen S i 


la suma de cuadrados de las distancias entre los 
valores observados Y, y los estimados Y;, esto 


es que minimicen la suma de cuadrados de las 
longitudes de los segmentos de las líneas 
verticales que unen los datos observados con 
la recta estimada en la gráfica de dispersión 
(ver Figura 12.8). 


Carl Gauss Adrien Marie Legendre 
y77T1BES 1752-1833 


P=B,+Bx 


$ —> X 


Figura 12.8. Desviaciones entre los puntos observados y la recta de regresión estimada. 
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n ES 
Mediante la minimización de y (y, = Y.) se obtienen buenas representaciones de la relación entre Xy Y, 


i=l 


tal como se muestra en la Figura 12.9 a), evitándose situaciones como las mostradas en las Figuras 12.9 b) 
a 12.9 7). 


a) Buena representación b) Recta muy alta 


c) Recta muy baja 


d) Recta con pendiente errónea 


Figura 12.9. Rectas de regresión que proveen buenas y malas representaciones de la relación entre Xy Y. 


Usando notación matemática, el método de mínimos cuadrados consiste en encontrar las expresiones algebraicas 
de PB, y Ê, que minimicen: 


La suma de cuadrados mínima que corresponde a los estimadores producidos por el método de mínimos 


cuadrados recibe el nombre de Suma de Cuadrados de Residuales o Suma de Cuadrados del Error (S.C. Error), esto 
último debido a que, en el modelo de línea recta: 


€, =Y,—By — B,X; 


y por tanto, un estimador de £; es: 
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o sea que €; estima el error presente en el modelo. La suma de cuadrados del error es entonces: 
n 7 n x 2 
S.C. ERROR = Y & = X (y, -f,) 
i=] i=l (12.9) 


Desde el punto de vista matemático, la principal característica del método es que si B, y B, son estimadores 


de $, y fi, distintos de los de mínimos cuadrados (P, y Ê, ) , entonces: 


S.C. ERROR = Y (r, -ĝ, PX) < $(x,-8, -8.x Y 
a = (12.10) 


Las ecuaciones para los estimadores Ê, y Ê, se obtienen mediante técnicas de cálculo diferencial que no 


discutiremos aquí. Nos concretaremos a presentar los resultados. Las expresiones para P, y Ê, son: 


=] (12.11) 


(12.12) 


Nótese que SPXX, SPXY y SPYY son los numeradores, respectivamente, de la varianza de X, la covarianza entre 


Xy Y y la varianza de Y. Con esta notación la expresión para f, es: 


2 _ SPXY 
ESPE (12.13) 


Ly 


Por tanto, la recta de regresión estimada tiene por ecuación: 
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Y, =P, +B,X, =P -B,X+B,X, =7+ĝ, (x, -X) 


(12.14) 


Ejemplo 12.4. Para ilustrar los resultados anteriores recurrimos a los datos del ejemplo 12.1, donde se tienen los 
pesos (X) y estaturas (Y) de diez individuos. Las estadísticas que necesitamos para estimar la recta de regresión son: 


Y X =614; $ X? =38596 
Y Y, =1613; Y Y? =260697 
Y XY, = 99586 
De donde: 
LIE 
SPXY = Y X.Y, — 22% = 99568 LAME) 209 y 
n 


(Ex) (614) 
n 


SPXX = Y X} — = 38596 === 896.4 
Er) 
n 


= 260697 — = 520.1 


2 
spYY = Y Y? — me 
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(De momento no necesitamos SPYY, pero será de utilidad posteriormente). 


El valor de f, es, entonces: 


>  SPXY _ 529.8 
= == === =0.591 
AT Bsa 


Además X =61.4 y Y =161.3 y, por tanto: 


PB, =Y -Ê X =161.3-(0.591)(61.4)=125.0126 


Y la recta de regresión estimada es: 


Y, =125.0126+0.591X, 


En la Figura 12.10 se presentan el diagrama de dispersión de los datos y la recta de regresión estimada. 


180 


Y =125.0126+0.591X 


40 50 60 70 80 
Figura 12.10. Diagrama de dispersión de diez pesos y estaturas y la recta de regresión estimada por mínimos cuadrados. ® 
El lector debe verificar que la S.C. ERROR para estos datos es: 
10 eS ds 2 
S.C. ERROR = Y (Y, - $, —B,X,) 


i=] 
10 

= Y (Y, -125.0126—0.591X,)' = 206.91 
i=l 
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Para cualesquiera otros valores de los estimadores obtendremos una S.C. ERROR mayor que ésta. Aunque este 
hecho sólo puede probarse analíticamente, puede verse que cambios pequeños en los valores estimados de BoyB; 
alteran mucho la suma de cuadrados de las discrepancias. Por ejemplo, para f =120 y Ê, =0.5 obtenemos: 


10 
Y (Y, -120-0.5X, )? =1323 


i=] 


Ejemplo 12.5. Como segundo ejemplo estimamos la recta de regresión para los datos del ejemplo 12.2. Las 
estadísticas necesarias son: 


7 7 
Z KL; 2, X? =0.8864; SPXX = 0.2683 
i=] i=] 

7 7 
2 Y, =11287.60; Y Y? =36159427.2; SPYY = 17958010.95 
i=] i=] 

7 


È XY, =1244.4; SPXY = -2109.6297 
i=] 
De donde: 


2 _ —2109.6297 


= = —7862.9508 
l 0.2683 3 


Además, X = 0.2971 y Y =1612.5143, por lo que: 


A 


Po =1612.5143—[(-7862.9508)(0.2971)] = 3948.5970 


La recta de regresión estimada es: 


Y, = 3948.5970 — 7862.9508X,. 


El diagrama de dispersión y la recta de regresión estimada se ilustran en la Figura 12.11. 


Ejemplo 12.6. Considérense ahora los datos del ejemplo 12.3, donde se presenta el número de empleados (X) y 
ventas semanales en cientos de miles de pesos (Y) en 15 supermercados. En ese caso: 


1 


in 
vi 


X; = 430; X? =14158;SPXX =1831.3333 
i=] i=l 
15 15 

Y, =170; Y? =2262;SPYY =335.3333 


a 
ll 
pun 
w 
ll 
pun 


; SPXY =761.6667 


Ms 
Ps 
sS 
Il 
U 
CON 
O 
YD 


ma 
D 
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5000 


4000 


3000 


Y =3948.597 —7862.951X 


0.10 0.20 0.30 0.40 0.50 0.60 


Figura 12.11. Diagrama de dispersión y recta de regresión ajustada para los datos del ejemplo 12.2. € 


De allí que: 


> _ 761.6667 


= ————— = 0.4159 
p, 1831.3333 


Además, Y =11.3333 y X = 28.6667, de donde: 


A 


Ba =11.3333 — (0.4159)(28.6667) = —0.5892 


La recta de regresión estimada es: 


Y, =-0.5892+0.1459X, 
En la Figura 12.12 se presenta el diagrama de dispersión y la recta de regresión estimada. 


12.5. Interpretación de la ecuación de regresión estimada 


Cuando se obtiene una recta estimada de regresión se enfrenta inmediatamente al problema de interpretar, en 
el contexto del fenómeno de su interés, cada una de las componentes de la ecuación. En la interpretación se 
cometen a menudo errores graves, por lo que en esta sección discutiremos algunos de los más comunes. 
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Y =-0.5892+0.4159X 


4 8 12 16 20 24 28 32 36 40 44 48 


Figura 12.12. Diagrama de dispersión y recta de regresión estimada para los datos del ejemplo 12.3. 4 


Interpretación de la estimación de la ordenada al origen (Ba) 


Lo primero que queremos destacar es que en la ecuación de regresión estimada Y = Po F px , a un valor 
de X =0 corresponde un valor estimado Y = Bo» lo que indica que B, es el valor de la predicción para Y 
cuando la variable independiente toma el valor cero. Dado lo anterior, es importante señalar que fù no tiene 
interpretación práctica en muchos problemas. 


Tomemos los datos del ejemplo 12.4 para ilustrar lo que hemos afirmado. En ese caso la recta estimada fue: 


Y =125.0126+0.591X 


por lo que una interpretación mecánica de la ecuación nos llevaría a pensar que a un peso de cero kilogramos 
corresponde una estatura de 125.0126 cm, lo que es patentemente absurdo. El problema que enfrentamos entonces 
es el de darle sentido a la predicción para X = 0. El hecho es que en casos como éste el valor de f} es necesario para 


representar la tendencia que muestran los datos e7 el espacio de valores observados para la variable independiente, pero 
se carece de información para interpretar a $, como la predicción de Y cuando X toma el valor cero. 


Dicho esto surge inmediatamente una pregunta: ¿bajo qué condiciones es posible dar una interpretación práctica 
a Pp? Las dos condiciones más importantes son: 


a) Debe ser físicamente posible que X tome el valor cero 


b) Deben tenerse suficientes datos alrededor del valor X =0 


El ejemplo 12.4 es de tal naturaleza que la primera condición es imposible, y por lo tanto también lo es la 
segunda; en ese caso no tiene ningún sentido tratar de interpretar fg, aunque cabe decir que su valor sería 


ne 
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mucho menor si se hubiesen observado individuos con pesos menores. Esta idea la podemos reforzar analizando 
el ejemplo 12.6, donde se relacionó el número de empleados (X) y las ventas en cientos de miles de pesos (Y) 
en cierto tipo de supermercado. La ecuación de regresión estimada fue: 


Y, =-0.5892+0.4159X, 


por lo que interpretar Bo como las ventas en cientos de miles de pesos cuando no se tienen empleados también 
es impropio, ya que ello equivale a decir que sin empleados se venderán —58 920 a la semana. Nótese que aquí 
sí sería posible tener observaciones de X cercanas a cero aunque lo razonable es suponer que a valores de X = 0 
corresponderían valores de Y = 0. Aquí el problema es que el menor valor de X observado es 10, por lo que no 
se tienen datos cercanos a X =0. 


Hasta ahora hemos examinado el problema de la interpretación de fọ desde un punto de vista descriptivo 
y de sentido común, concluyendo que es poco razonable tratar de predecir el comportamiento de la variable 
dependiente para valores imposibles de la variable independiente. Cuando estudiemos el problema de la 
predicción desde el punto de vista de la inferencia estadística reforzaremos estas conclusiones. 


Interpretación del estimador de la pendiente o coeficiente de regresión (P,) 


El estimador de la pendiente (P, ), también llamado Coeficiente de Regresión Estimado, es de mucha mayor 
importancia que fọ, ya que nos indica la forma en que están relacionadas Xy Y, en el sentido que mide cuánto 
y en qué dirección se modifican los valores de Y cuando cambia X. Recuérdese que $, estima la pendiente de 
la recta, o sea el número de unidades que cambia Y por cada unidad de cambio en X. Al interpretar f, en un 
problema concreto, es necesario tener en cuenta las características del fenómeno que se estudia, ya que una 
interpretación exclusivamente matemática es generalmente insuficiente. 


Consideremos como ilustración la recta ajustada a los diez pesos y estaturas del ejemplo 12.4. La ecuación 
obtenida fue Y =125.0126+0.591X, y lo que usualmente se dice es que a un incremento de un kilo de peso 
corresponde un incremento de 0.591 cm. Si f, fuese negativa diríamos que hay un decremento en Y cuando 
X aumenta, lo que correspondería a una correlación negativa. Ahora bien, hay que tener cuidado con este tipo 
de afirmación. Supóngase que uno de los integrantes del grupo la interpreta en el sentido de que por cada kilo 
que aumente de peso su altura se incrementará en 0.591 cm, y decide comer hasta pesar 126.88 kg para medir 
dos metros. Por supuesto la situación ha sido caricaturizada para recalcar que la interpretación es absurda; sin 
embargo, este tipo de errores se cometen con cierta frecuencia. Aparte de la suposición —en este caso falsa— de 
que existe una relación causal del peso sobre la estatura, también es incorrecto pensar en términos de un solo 
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individuo. Recuérdese que una de las suposiciones del modelo es que para cada posible valor de X, Y es una 
variable aleatoria con distribución normal cuya media es 4y,yx. Lo correcto entonces es decir que las medias 
poblacionales de Y se incrementan al aumentar X o, desde un punto de vista pragmático, que los individuos 
de poblaciones con una diferencia de un kilogramo, en promedio difieren en estatura por 0.591 cm. De hecho 
aun esta afirmación habría que calificarla, ya que $, no es un parámetro sino un estimador, o sea una variable 
aleatoria sobre la cual es necesario hacer afirmaciones probabilísticas. De esto nos ocuparemos en las siguientes 
secciones. 


12.6. Propiedades de los estimadores de mínimos cuadrados. Estimación de o? 


Para obtener propiedades de Bo y Ê, recordamos al lector el resultado (10.3), que postula que si W,, W,,..., W, 


A 
son variables aleatorias independientes tales que W, ~ N ( IR. r $ entonces la variable y a;W, es tal que: 


i=l 


Saw, > n[ San Sao), 
= 


donde á, A),..., A, SON constantes conocidas. 
192 r 


Ahora bien, tanto $, como $, pueden escribirse en la forma prevista en el resultado (10.3). Para $, tenemos: 


y, = 26 -X)W 7) D(x - 27, Y (x, - X)Y 


AX) (x-3 E-F) 


Puesto que de acuerdo con nuestras suposiciones Y, ~ N (Bo + B$,X Moh la media de f} es: 


E(B,)= Y a (Bo +B,X,)= Bo), 4, +8, 4,X, 


X,-X 
El lector debe verificar que para 4, = SPIK , >a; =0y J a,X, =1 por lo que: 
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La varianza de $, es: 


=)2 
y E + E E a A ia) PSE o 
var(ĝ,)=05 = Edo" = Za =0 (SPXK)  (SPXX}  SPXX 


Y, por tanto $, es tal que: 


7 2 
B- nse 


También $, puede escribirse en la forma S ay, haciendo: 


1 X(x,-X) 
“r PX 
Y usando (10.3) puede probarse que: 
DAS 
B.=N|B,: —=L— 
Bo Pos py 


Aunque es un poco más difícil de demostrar, también la distribución del estimador de la recta de regresión es 
normal, según se asienta en seguida. Nótese que el valor de la recta de regresión estimada depende del valor de 
X para el que se quiere estimar. Así, para un valor fijo de X, digamos X), el estimador es: 


Eg + Po +Ê: Xo 


En este caso la varianza de Yy = My, y,» que estima la media de la distribución de Y para el valor X) (o sea 


My x, )» depende del valor X}. Dicha distribución es: 


A 


Y x, œN (uvix, = bo +B,X0505,, ) 


donde: 


Todos estos resultados se resumen en seguida. 
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Como es obvio de las propiedades distribucionales recién establecidas, los tres estimadores son insesgados, ya 
que la esperanza de cada uno de ellos es igual al parámetro que estima. Otra propiedad, no tan obvia como 
la anterior, es que son de varianza mínima en la clase de estimadores a la que pertenecen; esto es, que tienen 


mínima varianza entre los estimadores insesgados que pueden expresarse en la forma S a Y, o, dicho de otro 
modo, entre los que pueden escribirse como una combinación lineal de las observaciones. 


En la varianza de cada uno de los estimadores aparece 0”, la varianza de la variable dependiente . Con objeto de 
hacer inferencias usando dichos estimadores es indispensable entonces estimar g”. Además, el estimador de 0° 
nos indica la precisión del ajuste obtenido, según discutiremos posteriormente. 


Al explicar la idea detrás del método de mínimos cuadrados se dijo que los estimadores obtenidos minimizan 
la expresión: 


S.C. ERROR = Y (y -f,Y = Né; 


y que €; =Y, —Y, puede considerarse un estimador de £; Ahora bien, se supone que £; es una variable 
aleatoria con media cero y varianza 0”. Puesto que £; no es observable, parece razonable estimar su varianza a 
través de €;; y se ha encontrado que un estimador con buenas propiedades es: 


y SCEROR_ Dë _ MV) 
e a-2 n-2 n—2 
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Tal como se presenta arriba, la expresión para SŽ no es conveniente para fines de cálculo. En seguida derivamos 
una expresión equivalente transformando el numerador: 


Dlr -fY =D, -B,-8, Xx, = (1, -7+8,X-A,x,) 
= D| -7)-P,(x,-X) =30,-7) +B E(x -2Y 


-2ĝ, X (X; - X) (Y, - F) = SPYY + ĝ; SPXX — 2ĝ,SPXY 


P 
= SPYY +Ê, w 2 SPXx - -2B,SPXY 
= SPYY — B,SPXY 


O sea que una expresión alternativa para S.C. ERROR es: 


S.C. ERROR = X (Y, —P;)' = SPYY — P,SPXY (12.18) 


la que tiene la ventaja de que puede evaluarse a partir de las estadísticas básicas calculadas para obtener $, y f.. 


Sustituyendo o” por y en (12.15), (12.16) y (12.17) obtenemos estimadores para las varianzas de Po Ê, y 
Y x, . Estas varianzas estimadas son: 


2 SDE 
Po ASPXX (12.20) 
2 ve E 
A SPXX (12.21) 
= 2 
2 2 É (x.-X) | 
Po `e La" SPXX (12.22) 
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Ejemplo 12.7. Continuamos el análisis de los datos usados en los ejemplos 12.1 y 12.4, donde X representa el 
peso, Y la estatura, y se tienen 10 pares de observaciones. Antes se calculó: 


SPXY = 529.8; SPXX = 896.4; SPYY =520.1; X X? =38596; X =61.4. 


Además, f, =125.0126 y ĝ, =0.591. 
Las varianzas de estos estimadores son: 


2 _ 385960” 
Po (10)(896.4) 


2 


da =——=6014 
Êi 896.4 


= 4.30570” 


Para obtener estimadores de estas varianzas requerimos estimar 0”. Su estimador es: 


20.1—(0.591)(529.8 
Ez A =25.8735 


Por tanto, las varianzas estimadas de $, y $, son: 


S3 = (4.3057)(25.8735) = 111.4035 
S3 = (0.0011)(25.8735) = 0.0285 


Finalmente, si se desea estimar la recta para un valor X, de 49, digamos, la estimación es: 
Y x,=49 = 125.0126 + (0.591)(49) = 153.9716 


y la varianza asociada con esta estimación es: 


49 — 61.4) 
3 20 Ll 61.4) 


=0.27150? 
10 896.4 l si 


Y xo =49 
y su varianza estimada es: 


S$, =(0.2715)(25.8735) = 7.0247 


Ejemplo 12.8. Ahora calculamos varianzas y varianzas estimadas para los datos usados en los ejemplos 12.2 y 
12.5, que se refieren a pérdida esperada en pesos (Y ) y porción de humedad consumida (X ) al momento del 
riego en un cultivo de soya. Las cantidades necesarias se calcularon en el ejemplo 12.5. En este caso: 
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2 _ 0.88640” 
Bo (7)(0.2683) 
2 


2 O 2 
0% = = 3.72720 
Pi 0.2683 


= 0.47200? 


La S.C. ERROR es: 


S.C. ERROR = 17958010.95 — (—7862.9508)(—2109.6297) 
=1370096.413 


De donde: 


ș2 - 1970096.413 


5 x = 274019.2825 


por lo que las varianzas estimadas para fọ y f} son: 


3 = (0.4720)(274019.2825)=129337.1013 
S3 = (3.7272)(274019.2825) = 1021324.67 


Para predecir el valor promedio de Y dado un valor de X = 0.50 obtenemos: 


A 


Y y-0.50 = 3948.5970 + (—7862.9508)(0.50) = 17.1216 


y la varianza de Y para X =0.50 es: 


.5—0.2971)? 
e 2 05 MT nina [029650 
7 0.2683 


Y la varianza estimada es: 


(0.2963)(274019.2825)=81191.9134 y 


Ejemplo 12.9. En los ejemplos 12.3 y 12.6 se analizaron observaciones del número de empleados y ventas 
semanales en 15 supermercados. Se pide al lector que verifique que, para estos datos: 


05 =0.51540? 


0> = 0.000550? 
1 


S.C. ERROR =18.5561 


.. 
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S? =1.4274 
Sp, =0.7357 
S3 = 0.00079 


La predicción para 30 empleados (X, = 30) es: 


Feas =11.8878 


con varianza: 


o? = 0.06770? 


Y xo=30 


y varianza estimada de 0.0966 


12.7. Pruebas de hipótesis e intervalos de confianza para Pp y $; 


Hasta ahora hemos estimado los parámetros del modelo de línea recta, establecido sus distribuciones y estimado 
sus varianzas. Como ya sabemos de los capítulos anteriores, el siguiente paso consiste en usar conjuntamente 
un estimador y su varianza para producir inferencias sobre el parámetro de interés. En el caso de B, y f} no 
requerimos de ningún concepto nuevo para proceder a hacerlo, ya que estamos en el caso, examinado muchas 
veces antes, en que se quiere inferir sobre la media de una variable aleatoria cuya distribución es Normal. En 
efecto, en la sección 12.6 se estableció que: 


A 


Bo ~ N(Bo,0%, ) 


A 


Ê, -N(B,0% ) 


2 
Bo 
inferir sobre fo y $, no involucra ninguna novedad. En seguida presentamos de nuevo, y con la notación de este 
capítulo, las hipótesis de interés. 


Además, en las expresiones (12.20) y (12.21) se tienen estimadores para 07 y 0% . Por tanto, el problema de 


Sea B; (¿=0,1) un número arbitrario. Los juegos de hipótesis que consideraremos son: 
a) Ho: f,< f; en oposición a Ha: B, > f;, (i=0,1) 
b) Ho: fB,> f; en oposición a Ha: B; < Bis (i¡=0,1) 


c) Ho:ß; =P; en oposición a Ha: fB, + f., (¡=0,1) 


Capítulo 12 
REGRESIÓN LINEAL SIMPLE 


Dado que la distribución de £, (¿= 0,1) es Normal, la estadística de prueba es nuestra vieja conocida: 


to <E-É ,(=0,1) 


a 


B, (12.23) 


La única novedad es que los grados de libertad de %,, que tiene una distribución ż de Student cuando 
B, = B; (¿=0,1), son ahora n—2, que es el divisor de S?, el estimador de o°. Por tanto, las reglas de decisión 
para los juegos de hipótesis a), b) y c) son: 


a) Rechazar Ho si t) > t,¿(n—2) 
b) Rechazar Ho si tọ S —1,¿(n— 2) 
c) Rechazar Ho si tọ > tan (n—2) o si ty < —t,¿(n—2) 


Siguiendo técnicas similares a las que han venido discutiéndose desde el capítulo 8, también resulta sencillo 
derivar intervalos de confianza para o y f}. Usando la distribución de + es fácil concluir que un intervalo de 
confianza de nivel 1— æ para f; (¿=0,1) está dado por (1,2), donde: 


L=, -Sz tan (m2) 


L=B,+S» tan(n—2), ¡=(0,1) 
ae (12.24) 


En seguida se presentan ejemplos ilustrativos. 


Ejemplo 12.10. En el ejemplo que se ha venido analizando, donde la variable independiente representa el 
número de empleados en supermercados y la dependiente mide las ventas semanales, una hipótesis interesante 
es Ho: Po =0 en oposición a Ha: Po #0, ya que es razonable que a X =0 corresponda Y =0. En ejemplos 
anteriores encontramos que, para esos datos: 


PB, =-0.5892; S? =0.7357 


0 


Por tanto: 
pa 0.8577 
El valor de es: 
= SA = —0.6870 


Con & = 0.05 y 13 grados de libertad, obtenemos de la tabla correspondiente żọ.o25 (13) = 2.160, por lo que 
concluimos que los datos muestran evidencia significativa (4 = 0.05) de que la ordenada al origen es cero. De 


hecho, los límites del intervalo de confianza al 95 % para fọ son: 
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= 0.5892 —(0.8577)(2.160) = — 2.4418 


L 
L = —0.5892 + (0.8577)(2.160) = 1.2634 
por lo que el intervalo de confianza (—2.4418, 1.2634) incluye a cero y, por tanto, con & = 0.05 no puede 
rechazarse la hipótesis nula propuesta. 


Supóngase ahora que queremos decidir si $, > 1, es decir, si el aumento en ventas por cada empleado extra es 
mayor de cien mil pesos. 


El juego de hipótesis es Ho: f, <1 en oposición a Ha: f, >1. En el ejemplo 12.6 encontramos 


ĝ = 0.4159 y en el 12.9 obtuvimos S2 = 0.00079. De aquí que S, = 0.0281 y el valor de la estadística 
1 y ĝ, qui q ĝ, y 


de prueba es: 


_0.4159—1 


j= = —20.7865 
0.0281 


que es un valor para el cual no se rechazaría Ho con ninguna & razonable. Así, para 4 = 0.10 el valor crítico es 
to.10(13) =1.350, por lo que no se rechaza Ho con A = 0.10 y se concluye que $, <1. 


Un intervalo de confianza al 99% para f} tiene como límites: 


= 0,4159—(0.0281)(3.012)= 0.3313 


L 
L=0.4159+(0.0281)(3.012)=0.5005 y 

Seguramente la hipótesis más importante sobre el coeficiente de regresión $, es que tiene el valor cero, ya 
que en ese caso se concluye usualmente que no existe relación entre las variables y, por ende, que X no es de 
utilidad para predecir a Y. Aunque esta interpretación requiere un análisis más fino, el cual emprenderemos 
en la sección 12.10, la hipótesis Ho: $, =0 en oposición a Ha: $, #0 merece atención especial. En el 
siguiente ejemplo probamos esa hipótesis mediante la prueba de ż que acabamos de introducir, y en la 
siguiente sección presentamos el análisis de varianza de la regresión, que provee una forma alternativa de 
probar esta hipótesis. 


Ejemplo 12.11. Para los datos de pesos y alturas usados en los ejemplos 12.1, 12.4 y 12.7 obtuvimos Ê, =0.591 


y S3 = 0.0285. Para probar Ho: $, =0 en oposición a Ha: f, #0 la estadística es: 
1 


_ 0.5910 


th = ——= 
° /0.0285 


= 3.5008 


Se tienen 10 pares de observaciones, por lo que para probar la hipótesis con œ = 0.01 los valores críticos son 
to.005(8) = 3.355 y —to.005(8) = — 3.355. Puesto que t, > 3.355, se rechaza Ho y se concluye, con a = 0.01, 
que la pendiente de la recta es mayor de cero. 0 
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12.8. Análisis de la varianza de la regresión 


La técnica de análisis de varianza (A de V) nos es familiar desde el capítulo 11, donde se presentó en conexión con 
otros modelos lineales allí discutidos. Como en el caso del modelo Y, = u + £;, o los que se usan para comparar 
dos tratamientos, aquí se utiliza como alternativa a la prueba de 1 para el juego de hipótesis Ho: pı =0 en 
oposición a Ha : B, # 0. En ese sentido su importancia es limitada, y no valdría la pena presentarlo. Su utilidad 
en este caso radica más bien en que nos permite comprender con mayor profundidad el análisis de regresión. 


Como en los modelos del capítulo 11, el A de V parte de una igualdad algebraica muy sencilla. En efecto, es 
claro que, según se muestra gráficamente en la Figura 12.13: 


y, -F=(y, 7, )+(9, -7) 


(12.25) 


En la ecuación (12.25) Y, —Y es la desviación de una observación de la variable dependiente con respecto 
a su media (desviación total); Y, —Y, es el error estimado, también llamado “desviación debida al error”; y, 


finalmente, Y, —Y es la desviación del valor estimado de Y con respecto a la media, y es claro que su valor 


numérico depende de la pendiente de la recta estimada (a mayor pendiente mayor valor absoluto de Y, Y), 


1 
de la recta es todavía más evidente si tomamos en en cuenta que para la recta estimada por mínimos cuadrados 


y por ello se le llama “desviación debida a la regresión”. Que el valor de Y, —Y se incrementa con la pendiente 


la media de los valores observados (Y) es igual a la media de los ajustados Y (ver ejercicio al final del capítulo). 
En palabras, la partición de la variabilidad es: 


Desviación total = Desviación debida al error + Desviación debida a la regresión. 


Biz =P, +X 


_ÍIEAáA44A _—_-_A<AAANNNNMMMMIMIIINN2>2 A A A) AAA AX 


Figura 12.13. Partición de la variabilidad de la variable dependiente. 
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Puesto que esta igualdad es cierta para todas las observaciones, podemos escribir, a partir de (12.25): 


DP) =S (1, -7,)+ (2, -7)] 


i=l] i=l 


De donde: 


¡=1 ¡=1 ¡=1 (12.26) 
O, en palabras: 


S.C. TOTAL = S.C. ERROR + S.C. REGRESIÓN. 


Como todas las expresiones que involucran desviaciones, los componentes de ( 12.26) no son prácticos para fines 
de cálculo. Enseguida derivamos formas alternativas. 


S.C. REGRESIÓN = Ê; SPXX = ĝ, (EZ) =P, SPXY 


=N(P-8B,X+P,X, =P) 
= BD (x,-X) =Pispxx 


Además, puesto que Ê, = SPXY /SPXX , tenemos: 
S.C. REGRESIÓN = $; SPXX = Î, (Z) = ĝ SPXY 
Por otra parte, en la sección 12.6 se mostró que (ver ecuación 12.19): 
S.C. ERROR = SPYY — B, SPXY 
En cuanto a la S.C. TOTAL, es simplemente igual a SPYY 


os 
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Estas sumas de cuadrados pueden usarse para realizar una prueba de hipótesis sobre $; mediante la distribución 
F. Ésto es porque sus distribuciones están relacionadas con la de Ji-cuadrada. Consideremos por ejemplo la S.C. 


REGRESIÓN = B SPXX . De la ecuación 12.16 sabemos que: 


i 2 
Ê; 3 m8, 


SPXX 
por lo que: 
VSPXX 
(BA) ~ N(0,1) 
O 
de donde: 


De aquí que bajo Ho: p} =0 tengamos que: 


+ A2 
S.C. REGRESION a bi SPXX 3 
2 > p 7 Xa) 


O 
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Igualmente puede probarse que: 


S.G; TOLAL 2 
E [lep 


S.C.ERROR > 


a X(n—2) 


De modo que para probar Ho: fB, =0 en oposición a Ha : fB, #0, la estadística: 


S.C. REGRESIÓN 


iias 07 (1) _ S.C. REGRESIÓN 
0” S.C.ERROR ye 
0*(n—2) 


tiene una distribución de F con 1 y n—2 grados de libertad. Una prueba de tamaño & para Ho: B, =0 en 


oposición a Ha: f, #0 se obtiene mediante la regla de decisión: Rechazar Ho si F) 2 F} a. El lector debe 
verificar que F) es el cuadrado de la estadística £, usada para probar el mismo juego de hipótesis en la sección 
precedente. Estos resultados se acostumbra presentarlos en la tabla de Análisis de Varianza (Tabla 12.2), donde 
hemos incluido la columna de Esperanzas de Cuadrados medios que, al igual que en los casos del capítulo 11, 
ayudan a comprender mejor la lógica de la prueba. 


Tabla 12.2. Tabla de A de V del modelo Y, = fB, + B,X, +€,. Ho: P, =0 en oposición a Ha: B,%0. 


Fuente de Grados de Esperanzas de 


variación libertad Sumas de cuadrados Cuadrados medios Eo cuadrados medios 
> ĝ ĝ SP. deci 
Regresión 1 B,SPXY paz == o? + B?SPXX 
Error n—2 SPYY — B,SPXY gis Si A o 
n—2 
Total n= 1 SPYY 


. ez . . 1 7 . . 
La regla de decisión consiste en rechazar Ho si F) 2 F}_, a. Nótese que cualquier valor (diferente de cero) de $, 
aumenta la esperanza del numerador de F} y, por tanto, es lógico que la cola de rechazo sea la derecha. 


Ejemplo 12.12. En un experimento para estudiar el efecto de la exposición a bajas temperaturas sobre el bacilo 
de la fiebre tifoidea se expusieron cultivos del bacilo durante diferentes periodos de tiempo a una temperatura de 
—5 °C. Los datos se presentan en seguida. X es el número de semanas de exposición y Y el porcentaje de bacilos 
sobrevivientes. (Fuente: Science, Marzo 1, 1901. pág. 323). 


ED. 
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AAA AAAAAAAAAA<— AAA AAA AA 
X 0 0.5 1 2 3 5 7 9 12 15 18 22 
Y 100 42 14 qa 0.4 0.11 0.09 0.05 0.005 0.002 0.0001 0 


Para estos datos: 


Y x, =94.5; X =7.875; Y, X? =1346.25; SPXX = 602.0625 
SN Y, =164.1571; Y =13.6798; $, Y; =12016.4327 
SPYY =9770.8032 
S XY, =51.8418; SPXY =-—1240.8954 
n=12 


Con estas estadísticas pueden aplicarse todas las técnicas presentadas hasta ahora. Aquí sólo calcularemos la recta 
estimada y presentaremos el A de V. 


El estimador del coeficiente de regresión es: 


a  —1240.8954 
= A = 2.0611 
Bi 602.0625 


El valor negativo de $, indica que el porcentaje de bacilos vivos disminuye con el tiempo de exposición. 


El estimador de la ordenada al origen es: 


A 


Ba =13.6798—(-2.0611)(7.875) = 29.9110 


Por lo que la recta estimada es: 


F; =29.9110—2.0611X, 


Para la tabla de A de V requerimos: 


S.C.TOTAL = SPYY = 9770.8032 


S.C. REGRESIÓN = ĝ,SPXY = (—2.0611)(— 1240.8954) 
= 2557.6095 
S.C. ERROR = S.C. TOTAL — S.C. REGRESIÓN 
= SPYY — B,SPXY = 9770.8032 — 2557.6095 
=7213.1937 


La tabla de A de V se presenta abajo. En ella se obtiene una estadística F = 3.5457. Comparada con o 
vemos que en Ho: f, =0 en oposición a Ha: P, 40 se rechaza Ho para 4 =0.10, pero no para & = 0.05, ya 
que Fo,0.10 =3.2850 y Ko,005 = 4.9646. 
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Fuente de Grados de Sumas de Cuadrados 


variación libertad cuadrados medios Eo 
Regresión 1 2557.6095 2557.6095 3.5457 
Error 10 7213.1937 721.3194 
Total 11 9770.8032 


La conclusión del A de V es que X (tiempo de exposición) explica en cierta medida a Y (porcentaje de bacilos 
sobrevivientes). Pero el hecho de que no se rechace Ho: f, =0 con æ = 0.05 debe hacernos pensar sobre qué 
tanto explica X a Y. A reserva de que en la sección 12.10 profundicemos en la interpretación de las inferencias 
sobre o y fi en seguida adelantamos algunas consideraciones. 6 


12.9. Precisión de la recta de regresión estimada 


En todas las inferencias que hemos realizado en el modelo de regresión lineal simple juega un papel preponderante 
S?, el estimador de o°. Esto es natural, ya que Var(Y,)=0? (¿=1,...,n), y la variabilidad de un fenómeno 


e 
s . . z . , . 2. 
influye en las inferencias que sobre él se realizan. Así, la magnitud de S/ influye en el valor de F, en el A de V, 
2 2 a A > À 
puesto que a mayor 5, menor es el valor de F}. A mayor S; mayores son las varianzas estimadas de f,, fP, y 


A sa a nada y 2 

My y x, - O sea que la confiabilidad de estos estimadores disminuye a medida que aumenta $, que aparece como 
0 

factor en las expresiones para sus varianzas estimadas (ver ecuaciones 12.20, 12.21 y 12.22). De aquí que un 


TIRE z . ., oo. 2 . , 
objetivo fundamental de las técnicas de regresión sea minimizar $? = Cuadrado Medio del Error. Recuérdese 
que, de hecho, el método de mínimos cuadrados consiste en minimizar la S.C. ERROR, y en consecuencia 


S.C. ERROR 


n— 


rA OT” 2 » 2 > . . . 
minimiza $, = . Si S; es “grande”, las inferencias son poco confiables. Desgraciadamente el 


problema de decidir cuándo S7 es grande es complicado, ya que la magnitud de S7 depende principalmente de 
dos factores: 


Ed . . . .t. 2 
a) El fenómeno que se estudia tiene, por su naturaleza, mucha variabilidad y, por tanto, 0” es grande. 
b) El modelo empleado (en este caso el de línea recta) no es el apropiado. 


El problema de usar un modelo incorrecto será examinado con cierto detalle en una sección posterior. Por lo 


., 2 . 2 z 
pronto llamamos la atención del lector sobre el hecho de que $, como estimador de 0” (la varianza de Y), 
depende de las unidades de medición y, por tanto, es inútil tratar de comparar dos situaciones distintas. En 
todo caso lo que sí vale la pena examinar es el coeficiente de variación de la variable dependiente, o sea C.V. 


(Y) = S, / Y . En los 4 juegos de datos que hemos utilizado hasta ahora tenemos: 
Pesos (X ) y estaturas (Y ): 


Y =161.3; S, =5.087; C.V.(Y) = 0.0315 


Humedad consumida (X) y pérdida esperada (Y): 


Y =1612.5143; S, =523.4685; C.V.(Y') = 0.3246 
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Número de empleados (X ) y ventas semanales (Y ): 


Y =11.3333; S, =1.1947; C.V.(Y)=0.1054 


Tiempo de exposición (X) y porcentaje de bacilos sobrevivientes (Y ): 


Y =13.6798; S, = 26.8574; C.V(Y) =1.9633 


e À 
de 


Nuestras herramientas para juzgar la precisión del ajuste serán el Cuadrado Medio del Error (s: ) y el Coeficiente 
de Variación de Y. 


12.10. Interpretación de las inferencias sobre fo y f1- 
Ajuste de rectas por el origen 


Inferencias sobre Bo. By es, como ya se dijo, la ordenada al origen de la recta, o sea el valor de Y cuando X =0. 


Por ello, su estimador fọ es el valor de la predicción Y y-o. En la sección 12.5 establecimos que para que Bo 
tenga una interpretación práctica debe ser físicamente posible que X tome el valor de cero, además de que 
debe tenerse observaciones alrededor de este valor. Ahora reforzamos estas ideas desde el punto de vista de la 


inferencia estadística. La varianza del estimador $, es: 


2 o È X i 
o = — < 
Po nSPXX 
y su varianza estimada: 
1 GDX 
Po NSPXX 


; A 2 , 2 
de donde apreciamos que la varianza de f se incrementa proporcionalmente con Y X? de modo que la 


confiabilidad de Jọ es mayor cuando las observaciones de X se realizan cerca de cero, y el estimador Bo es 
inútil cuando los valores observados se encuentran muy distantes de cero. Es con esta idea en mente que 


deben interpretarse las inferencias sobre g. Por supuesto, estas observaciones son evidentes en los intervalos 


; ; 2 
de confianza para fọ, cuya anchura es directamente proporcional a S3 y, por tanto, a j X; ; de manera que la 
0 


información proporcionada por el intervalo de confianza para fọ es mayor si las observaciones están cercanas a 


X=0. 


Un caso de importancia especial se tiene cuando, ya sea por consideraciones teóricas o por la naturaleza 
empírica del fenómeno que se estudia, se considera que fọ =0. En ese caso puede ajustarse el modelo 
alternativo: 


Y =p} X; +e; i=1..n (12.30) 
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. > E - 
en el cual el estimador de mínimos cuadrados para ff es: 


a+ hos XY; 
i7 2 
2 Aa (12:31) 
y se tiene la recta de regresión estimada: 
a a+ 
ies (12.32) 


La S.C. ERROR en este modelo es: 


S.C. ERROR =D (Y, -7, ' = DY? -A D xY, 


y el estimador de o”: 
A+ 
y? — XY 
n—1 (12.33) 
Además: 
B 2 
$6 TOTAL= Y E (12.34) 
y 
7 +) at 
S.C. REGRESIÓN (8;)= $, X XY, (12.35) 
a+ 
La varianza de B; es: 
j e 
OE 
ĝi 2 
2 Y; (12.36) 
y su varianza estimada: 
2_ S 
ĝi 7 
YX, (12.37) 


(El lector debe notar el divisor n—1 en 12.33. La razón es que en este modelo sólo se ha estimado f,, y no Bf, y 
Bi» como en los otros casos de este capítulo.) 


om 
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Con las ecuaciones (12.31) a (12.37) podemos reproducir las inferencias presentadas antes, ahora en el 
modelo (12.30). Lo que nos interesa destacar por el momento es que no debe adoptarse el modelo con fo =0 
meramente porque en el modelo Y, = Bo +B,X;+€, no rechazamos Ho: Bo = 0. Esto puede ocurrir porque 


no se observaron puntos cercanos a X =0, dando una varianza muy grande para fọ. Insistimos en que la 
adopción de un modelo con fọ =0 debe estar precedida por consideraciones teóricas, y para hacer el ajuste es 


necesario observar valores de X cercanos a cero, ya que de otro modo la inferencia sobre $, no tiene sentido, y $, 
debe tomarse únicamente como una constante que permite describir la tendencia de Y en el espacio de valores 
observados para X. Los siguientes ejemplos nos ayudarán a comprender mejor lo antes expuesto. 


Ejemplo 12.13. En varias secciones de este capítulo se han estudiado los datos de ventas semanales en cientos 
de miles de pesos (Y ) y número de empleados en supermercados (X). El modelo de línea recta ajustado fue: 


Y =-0.5892+0.4159X 


con un estimador de o”: 


S? =1.4274 


En este caso es razonable suponer que a un valor de X = 0 corresponda un valor Y = 0. Además, en el ejemplo 
12.10, al probar Ho: Bo =0 en oposición a Ha: Bo 40 no se rechazó Ho, con a = 0.05. Dado lo anterior es 
lógico tratar de ajustar un modelo con f, =0. Las estadísticas necesarias son (ver ejemplo 12.6): 


Y X? =14158; J Y; = 2262; D, X,Y, = 5635 


Por tanto, para el modelo Y, = Bi X; + €; obtenemos: 


1 


ĝi = 2i = 0.3980 
Además: 
5? = 2262 —(0.3980)(5635) =1.3764 
14 
El modelo ajustado (con fo = 0) es: 
Y =0.3980X. 


En la Figura 12.14 se grafican los dos modelos ajustados sobre el diagrama de dispersión de los datos. 


Como puede verse en la figura y en las ecuaciones respectivas, los dos modelos son muy similares. En cuanto 
$ Ag . . 2 . ., 
a la precisión del ajuste, se mide comparando los valores de 5, eligiéndose por regla general el modelo con 


2 2 ii : 
menor S?. En este caso el valor de S; es ligeramente menor en el modelo con $, =0. Si sumamos a esto que 


qa 
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en el ejemplo es lógico que ù tome el valor cero, que es preferible un modelo con el menor número posible 
de parámetros (entre los que tienen C.M. ERROR similares), la recomendación sería que se utilice el modelo 


Y = 0.3980X para predecir a Y a través de X. 


20 


12 


Y =0.398X 


Y =-0.5892+0.4159X 


4 8 12 16 20 24 28 32 36 40 44 48 52 


Figura 12.14. Dos modelos diferentes ajustados al mismo conjunto de datos. ® 


Ejemplo 12.14. Consideremos ahora los datos de pesos (X ) y estaturas (Y ) de 10 individuos presentados en el 
ejemplo 12.1. En el ejemplo 12.4 se ajustó por mínimos cuadrados la recta: 


Y =125.0126+0.591X 
la cual tiene un estimador de o? que es (ver ejemplo 12.7): 


S =25:8735 


En este caso podría argumentarse que, a un peso de cero kilogramos debe corresponder una estatura de cero 

Ld , + . . 
centímetros y, por tanto, que el modelo debería ser Y, = ff X, +e,. Para ajustar este modelo requerimos las 
estadísticas (ver ejemplo 12.4): 


Y X? =38596; © X,Y, =99568; Y Y? = 260697 


Por lo tanto obtenemos: 


E 
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La recta ajustada es: 


Y =2.5797X 


El estimador de 0? con este modelo es: 


?= 260697 —(2.5797)09586) _ 426.8256 
9 

Es decir, que con el nuevo modelo, la precisión de nuestro ajuste es mucho menor. Esto es fácilmente apreciable 

en la Figura 12.15, donde puede verse que al forzar a que la recta pase por el origen hemos magnificado los 

errores de ajuste. La lógica del investigador que propone en este caso un modelo con fù =0 no es totalmente 

errónea. El problema es que el valor X = 0 es imposible, y que los valores cercanos a cero que sí son posibles 

no se observaron en el experimento. Si se hubieran observado valores de X tales como 3, 4 o 5, el valor de 


Po obtenido para el modelo Y, = fB, + X; +£; sería mucho menor. Dadas las condiciones experimentales 
examinadas, lo único que puede recomendarse es usar la recta ajustada para representar la tendencia de los datos 


en el espacio de valores observados. En ese espacio de valores es preferible la recta Y, =125.0126+0.591X; 
para predecir a Y en función de X. 


180 


170 Y =125.0126+0.591X 


160 


150 


40 50 60 70 80 


Figura 12.15. Dos modelos diferentes ajustados al mismo conjunto de datos. 


Inferencias sobre fB,. Al igual que en el caso de fp, las inferencias sobre f, dependen, por lo que toca a su 


RT 2 . iy . 
confiabilidad, del valor de $, como es evidente de la expresión para su varianza, que es: 
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la cual se estima por: 


is e 
da = E 
B  SPXX 


. ., . EE N, 2 . 
De modo que desde el punto de vista de $, también se requiere minimizar S. De paso anotamos que la varianza 


de Ê, disminuye si aumenta SPXX = > (Y ¿XX y lo que sugiere que se obtienen mejores inferencias sobre B; 


a medida que el intervalo de valores observados para X es mayor. 


Particularizando un poco la discusión, hacemos notar que la prueba del juego de hipótesis Ho: P, =0 en 
oposición a Ha: fP, #0 es sin duda la más importante en el modelo de regresión lineal simple, ya que de ella 
depende la decisión de si la variable independiente X contribuye o no a predecir a Y. La interpretación de esta 
prueba de hipótesis a menudo es errónea, por lo que en seguida se analizan las situaciones típicas y se da una 
guía para su análisis. 


1. No se rechaza Ho: $, =0 


En las Figuras 12.16 a) y 12.16 b) se ilustran dos casos en que el análisis de regresión lineal simple llevaría a 
concluir que f} =0. 


Los conjuntos de datos de las Figuras 12.16 a) y 12.16 b) nos llevarían, ambos, si sólo atendemos al resultado de 
la prueba de hipótesis, a concluir que X'no contribuye a predecir a Y. Sin embargo, los diagramas de dispersión 
sugieren explicaciones muy distintas para las dos situaciones. En el primer caso ocurre que el modelo de línea 


recta puede ser adecuado, sólo que con $, = 0. Es decir, que Y es tan buena como Y = f, + f, X para predecir 


a Y. En el segundo caso parece existir una relación entre Y y X, sólo que no de tipo lineal. En la figura la relación 
insinuada es de tipo cuadrático, pero también podrían obtenerse ajustes de rectas con pendiente cero cuando la 
relación involucra funciones de X más complejas. 


b) 


e | 


Figura 12.16. Dos conjuntos de datos para los que no se rechaza Ho: $, =0. 
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2. Se rechaza Ho: ,=0 


En las Figuras 12.17 a) y 12.17 b) se grafican conjuntos de datos para los cuales concluiríamos que $, #0, 
es decir, que X contribuye a predecir a Y. En el primer caso X provee suficiente información para predecir a Y, 
mientras que en el segundo, a pesar de que el modelo Y, = fo + fP,X, +€; es mejor que uno que no incluya a 
X, quizá el modelo propuesto sólo proporciona una aproximación al verdadero, que puede incluir funciones de 
X, según se ilustra en el ejemplo 12.15. 


Figura 12.17. Dos conjuntos de datos para los que se rechaza Ho: f, =0. 


Para ilustrar algunos aspectos de la discusión anterior analizamos el siguiente conjunto de datos. 


X —4 3 —=2 = 0 1 
Y 17.4 37 4.8 2.6 0.5 2.3 


Para ajustar el modelo Y, = f, + PX; +€; requerimos las estadísticas: 


1 


S x, =-9; X =-1.5; ), X? =31; SPXX =17.5. 
SY, =37.3; Y =6.2167; ) Y? = 432.19; SPYY = 200.3083. 
© X,Y, = —108.6; SPXY =-52.65 


Por tanto: 


P, =-3.0086; $, = 1.7038 


ie 200.3083 — (—3.0086)(— 52.65) 
Eo 4 


= 10.4764 


El coeficiente de variación de Y es: 
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S; 
C.V. (Y) = = = 0.5207 
Y 
Además: 
ə 10.4764 
b, 17.5 


Para contrastar Ho : p, =0 con oposición a Ha: p, 40 la estadística es: 


—3.0086—0 _ 


A 
° ./0.5987 


Para un nivel de significancia de Y = 0.05 obtenemos ty 175(4) = 2.776, por lo que rechazamos Ho con 4& = 0.05 
y concluimos que X contribuye significativamente a predecir a Y. 


El coeficiente de variación (52.07%) se consideraría alto en muchas ciencias experimentales. Observemos ahora 
el diagrama de dispersión y la recta ajustada en la Figura 12.18. Nótese que la situación es parecida a la que 
presenta la Figura 12.17 b), por lo que decidimos buscar un modelo alternativo que explique mejor la tendencia 


de la variable dependiente. El diagrama de dispersión sugiere una relación de tipo cuadrático, de tal forma que 
el modelo propuesto es: 


Y =b, +X +e 


Tal como se indicó en la sección 12.3, éste es un modelo de regresión lineal simple, aunque no sea de línea 
recta, y para recalcarlo basta definir la variable Z = X? como variable predictora o independiente. El modelo 
es, entonces: 


Y =B,+B,Z+e 


Los asteriscos agregados a los parámetros son para subrayar que la ordenada al origen y la pendiente son 
distintas de las que se tienen cuando se usa X como variable independiente. En seguida se presentan los datos 
transformados: 


Si ajustamos un modelo de línea recta a los datos transformados obtenemos: 
Y = 0.9906 +1.0115Z 


o, en función de la variable X: 


a 
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Y =0.9906+1.0115X? 


En la Figura 12.18 se muestra la gráfica del nuevo modelo, observándose que da mejores predicciones que el 
anterior. Además, es fácil verificar que ahora: 


S.C. REGRESIÓN ($; ) =199.3498 


y 
S.C. ERROR =0.9585.C.V. (Y) = 0.0787 
Por lo que: 
S? =0.2396 
Y 


— Y =1.7083-3.0086X 
la Y =0.9906+1.0015X 


Figura 12.18. Modelos lineal y cuadrático ajustados a un conjunto de datos. 4 


o lector debe verificar que para probar Ho: f; =0 en oposición a Ha: Bi #0, la estadística de prueba es 

= 28.8439, por lo que se rechaza Ho a niveles de significancia más extremos que en el modelo que utiliza 
a Px como variable predictora, o sea que X? contribuye significativamente a predecir a Y. Puesto que antes se 
concluyó que X también es útil para predecir a Y, queda el problema de decidir cuál de los dos modelos es mejor. 
Para ello basta comparar los C.M. ERROR respectivos. 


Modelo estimado g 
Y =1.7083—3.0086X 10.4764 


Y =0.9906+1.0115X? 0.2396 
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De la tabla es claro que la precisión del ajuste es mayor con X? como predictor, por lo que es preferible usar el 
modelo cuadrático. 


12.11. Inferencias sobre y;y . Predicción 


Muy frecuentemente el interés fundamental de un análisis de regresión se ubica en predecir el valor esperado 
y 5 P P 

de Y para valores específicos de X. Es decir, para un valor dado de X = X% predecir con cierta confiabilidad 
Myx, Las herramientas necesarias para ello las tenemos desde la sección 12.6, y si hemos esperado hasta ahora 


para abordar este problema es porque queríamos disponer de la experiencia que se ha ganado en las secciones 
precedentes, particularmente en la 12.10. En efecto, sabemos por la expresión 12.17 que: 


Es = N (úy ıx, = fo + PX, 14 ) 


y que: 


211 (Xo FR Xy 
o o, AE S 
Yyy y n SPXX 


. 2 . . sd E” . 
es un estimador de SẸ con 2—2 grados de libertad. Dado lo anterior, el procedimiento para probar hipótesis 
Xo 


sobre Uy, x, es ya conocido. La estadística de prueba es: 


donde Hoy es el valor especificado en la hipótesis nula, y los valores críticos se toman de la distribución de 
0 


tcon n—2 grados de libertad. La regla de decisión, como siempre, depende del juego de hipótesis de que se 
trate. Similarmente, es fácil concluir que un intervalo con nivel de confianza 14 para My, x, está dado por 


(LL) , donde: 


L=Yx +S; ; tan(n—2) 


0 Y xo 


(12.38) 


La anchura del intervalo obtenido es: 


Yx ) 


. . ` 2 ..., . ., 
por lo que, para un nivel de confianza dado, es directamente proporcional a S$ oala precisión de la estimación. 
Xo 


Ahora bien, considerando un conjunto de datos cualquiera, para el que se ha obtenido $7, la magnitud de S 
Xo 
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depende exclusivamente de X — X, o sea de la distancia entre la media de los valores observados para X y el 
valor X) para el que se quiere predecir. Mientras más alejado esté X de X (en cualquier dirección), mayor será 


S y mayor la anchura del intervalo resultante. Es decir, que la mejor predicción para My, x, se obtiene para 


Xo = X, y las predicciones son peores a medida que X; es un valor más distante de X. 


Ejemplo 12.16. Ilustraremos los resultados de esta sección con los datos de pesos y estaturas que hemos usado 
varias veces en este capítulo. La recta ajustada es: 


Y =125.0126+0.591X 


Además: 
n=10; X =61.4; SPXX =896.4; S? =25.8735 
De donde: 
So =,|25.8 =h 


Supóngase primero que queremos probar: 
Ho: My ¡x=49 =160 en oposición a Ha: Uyıx=49 #160 


Para Xo = 49 se tiene: 


Y x =49 = 125.0126 +(0.591)(49) = 153.9716 


1 (49-61.4) 
S2 = 25.8735| =+— |=7.0254 
Por tanto: 
_ 153.9716—160 _ 0 


t, 
p 7.0254 
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Para un & = 0.01, obtenemos de la tabla de ż, to.005 (8) = 3.355, por lo que no rechazamos Ho y concluimos que 
el valor esperado para X = 49 no es significativamente distinto de 160 (4 = 0.01). 


En seguida calculamos intervalos de confianza para 4y,x, en varios valores de X¿. El lector no debería tener 
dificultad en reproducir los cálculos que se exhiben en la Tabla 12.3. Las bandas de confianza se presentan en la 
Figura 12.19. El nivel de confianza usado es de 95%. 


Tabla 12.3. Límites y anchuras de intervalos de confianza para My; x, (a = 0.05) 


Xo Ya Sh L I Actel 


48 153.3806 2.7875 146.9526 159.8086 12.8560 
49 153.9716 2.6506 147.8593 160.0839 12.2246 
52 155.7446 2.2667 150.5176 160.9716 10.4540 


56 158.1086 1.8518 153.8383 162.3789 8.5406 
62 161.6546 1.6118 157.9378 165.3714 7.4336 
63 162.2456 1.6313 158.4838 166.0074 7.5236 
67 164.6096 1.8688 160.3001 168.9191 8.6190 
68 165.2006 1.9608 160.6790 169.7222 9.0432 
71 166.9736 2.2907 161.6912 172.2560 10.5648 
78 171.1106 3.2467 163.6237 178.5975 14.9738 
Y (Estaturas) 
180 € 
170 + 
Y =125.0126+0.591X 
160 + 
150 + 
i: X=6l14 
> : / 
i X (Pesos) 


Figura 12.19. Bandas de confianza para la recta de regresión de diez pesos y estaturas. 0 


12.12. Regresión y causalidad 


El estudio de las relaciones entre variables ocupa un lugar preponderante en la ciencia moderna, en buena parte 
porque después de la revolución científica la idea de “causa eficiente”, en el sentido de algo que al manifestarse 
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produce un efecto reconocible, es una idea central del llamado “método científico”. De acuerdo con esto, no 
es extraño que la existencia de una relación funcional entre dos variables a menudo se interprete de manera 
mecánica como una relación de causa-efecto. En los casos en que la relación causal existe, las técnicas de las 
secciones precedentes nos ayudarán a cuantificarla, pero de ninguna manera podemos inferir este tipo de relación 
del mero análisis de regresión. Las razones por las que dos variables pueden aparecer relacionadas son múltiples, 
y a continuación analizamos seis de los casos más frecuentes. 


1.X y Y aparecen relacionadas porque X influye sobre Y 


Para ilustrar esta situación consideremos el caso en que la variable X representa el número de perforadoras mecánicas 
de tarjetas instaladas dentro de un centro de cómputo en una universidad y la variable Y representa el número de 
personas que forman colas en espera de poder usar las perforadoras. En este caso podríamos suponer que X y Y 
están inversamente relacionadas, dado que si aumenta el número de perforadoras instaladas, decrecerá el número 
de usuarios en las colas. Con base en esto estaremos tentados a concluir que X tiene un efecto causal sobre Y. 


2. Xy Y aparecen relacionadas porque Y influye sobre X 


Refiriéndonos de nuevo al caso anterior, puede suceder que la administración del centro de cómputo decida 
aumentar el número de perforadoras cuando las colas de usuarios crecen demasiado. Entonces fácilmente 
podemos pensar que Y causa a X, y que dichas variables están relacionadas en forma directa. 


3. Xy Y aparecen relacionadas porque interactúan entre sí 


Siguiendo con el mismo ejemplo, puede ocurrir que un aumento en el número de usuarios en las colas cause que 
se instalen más perforadoras, pero si el nuevo número de ellas es excesivo, el tamaño de las colas puede disminuir 
tanto que la administración decida eliminar algunas máquinas, lo que automáticamente eleva el número de 
usuarios en las colas. Aquí tenemos un ciclo ocasionado por la interacción entre X y Y, que es la que las hace 
aparecer relacionadas. 


4. X y Y aparecen relacionadas porque otra variable ( Z ) influye sobre ambas 


En un ejemplo famoso se observó una estrecha relación entre el número de aparatos de radio registrados en Gran 
Bretaña (X ) y el número de deficientes mentales certificados en el mismo país (Y ). Aunque no faltará quien 
pretenda usar estos datos para argüir sobre los efectos nocivos de la radiodifusión, la verdad es que aquí tenemos 
dos variables que crecen simultáneamente porque una tercera variable Z (el número de habitantes) influye sobre 
ambas. Si analizamos X y Y observamos una relación muy estrecha entre ellas. 


5.X y Y aparecen relacionadas porque actúan en forma similar debido al azar 
En un ejemplo muy frecuentemente citado en los tratados clásicos, se encontró una relación directa muy estrecha 
entre el número de nacimientos y el número de cigüeñas presentes en una ciudad de Europa. Ciertamente nadie 


mayor de 12 meses interpretaría esta relación como causal, y lo más seguro es que sólo se deba al azar. 


6.X y Y aparecen relacionadas debido a que la muestra no es representativa 


Puede ser que aunque poblacionalmente dos variables no estén relacionadas, los valores observados en la muestra 
indiquen una relación fuerte entre ellas por haberse recolectado valores atípicos de la población. 
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12.13. El coeficiente de correlación y su relación con la regresión lineal simple 


En la sección 3.6 definimos al coeficiente de correlación, y lo interpretamos como una medida de la asociación 
entre dos variables. Puesto que las técnicas de regresión lineal simple tratan de cuantificar esta asociación, cabe 
preguntar si existe alguna relación entre el coeficiente ryy y el modelo de regresión lineal simple. Para responder 
a esta interrogante basta manipular algebraicamente la expresión para ryy como sigue: 


, L SPXY _ JSPXX SPXY -%3 
Y = SyS, ASPXXSPYY NSPYY SPXX S% "' 


La relación es todavía más clara si elevamos al cuadrado ryy. Se tiene entonces: 


Si 22 _ BiSPXX _ B,SPXY 
s SPYY — SPYY 


En esta última expresión tenemos que el numerador es la S.C. REGRESIÓN y el denominador la S.C. TOTAL. 
O sea que el cuadrado del coeficiente de correlación es: 


2  S.C. REGRESIÓN 
r = —_———————————————————- 
a S.C. TOTAL 


A rèy se le llama el Coeficiente de Determinación. 


Nótese que dada la expresión: 
S.C. TOTAL = S.C. REGRESIÓN + S.C. ERROR 


0< rgy <1, por lo que es frecuente que al coeficiente de determinación se le use como una medida de la 
bondad del ajuste de los datos a la recta, ya que a mayor rgy menor es S.C. ERROR. Esta forma de medir el 
ajuste tiene algunos inconvenientes que no expondremos aquí por falta de espacio, únicamente insistimos en 
que la bondad relativa de dos modelos debe medirse por la magnitud de S?. 


Volviendo a ryy, una vez que hemos encontrado su relación con el análisis de regresión, queda el problema de 
cómo interpretarlo en este nuevo contexto. La principal dificultad que enfrentamos es que desde el punto de vista 
de la inferencia estadística, yy sólo tiene sentido si tanto X como Y son variables aleatorias, y en las suposiciones 
del modelo se consideró a X como variable no aleatoria. Un análisis de ryy involucra la formulación de un 
modelo probabilístico bivariado y no se incluirá en este texto. Por lo anterior, y con un criterio muy pragmático, 
visualizaremos a ryy exclusivamente como un índice de asociación entre Xy Y con las siguientes características: 
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1. A medida que ryy se aproxima a 1 o —1 existirá mayor evidencia de que en el modelo de regresión 
lineal simple la variable X contribuye significativamente a explicar a Y. Nótese que esto implica que la 
S.C. ERROR es cercana a cero [ver ecuación 12.39]. Si ryy = 1 o ryy = —1 los puntos observados caen 


exactamente sobre una recta. El signo depende del de f}. 


2. Si ryy tiene un valor cercano a cero, no hay razón para creer que existe una relación de tipo lineal entre 
X y Y. Nótese que si esto ocurre es porque S.C. REGRESIÓN tiene un valor muy pequeño en relación 
con la S.C. TOTAL. 


De cualquier forma insistimos en que tanto ryy como el coeficiente de determinación deben usarse únicamente 
como índices de tipo descriptivo bajo las suposiciones del modelo propuesto. Para una presentación elemental 
de las técnicas de inferencia sobre ryy remitimos al lector a la referencia 12.2. 


Ejemplo 12.17. Para ilustrar lo antes expuesto presentamos diferentes conjuntos de datos (ficticios) con sus 
diagramas de dispersión, recta ajustada y "yy. 


Refiriéndonos a la Figura 12.20 podemos observar que en el diagrama 4) los puntos se encuentran todos sobre 
una recta de pendiente $8, = 0.8, por lo que ryy = 1. En b) los puntos muestran una fuerte tendencia hacia 
una recta, encontrándose que rxy = 0.9563. En c) de nuevo se tiene una buena representación con una recta, 


sólo que esta vez con pendiente negativa ( PB, =- 1.17), por lo que el coeficiente de correlación es grande en 


valor absoluto y con signo negativo (ryy ==—0.9940). En d ), aunque los puntos todavía sugieren una línea 
recta, la relación no es tan estrecha como en los casos anteriores, lo que se refleja en una disminución del valor 
absoluto de ryy, que ahora es de 0.7238. Los diagramas e) y f) muestran situaciones donde ryy es pequeño 
en valor absoluto, aunque por diferentes razones. En el primer caso ryy = 0, a pesar de que parece existir una 
asociación fuerte entre X y Y, sólo que no del tipo que se representa bien por una línea recta, mientras que en 
el segundo caso, (f), ryy =—0.1697 y el diagrama no sugiere ningún tipo de asociación entre las variables. 
Finalmente en g), a pesar de que el coeficiente no es muy bajo (ryy =0.7570), la relación entre las variables 
podría representarse mejor por un modelo distinto del de línea recta. ® 


4.0 
2:3 
Y 3.0 Y 3.5 
25 


2.0 


E X b) 


Figura 12.20. Siete conjuntos de datos mostrando las rectas ajustadas y los coeficientes de correlación estimados. 
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Y =2.11+0.84X 


Figura 12.20. (Continuación). 


Errores cometidos frecuentemente al interpretar y 


En seguida presentamos dos errores de interpretación muy frecuentes. 


1. El coeficiente de determinación rgy no es una medida de la magnitud de Ê, como es fácil concluir de 
la Figura 12.21. 


=g- 
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2. Los valores de ríy no deben usarse por sí solos para decidir si el modelo empleado es el correcto o 
no. En la Figura 12.20 g) se muestra una situación en que rgy es relativamente grande (0.5730) y, sin 
embargo, el modelo no es el apropiado. Lo mismo sucede en el ejemplo 12.15, donde roy =0.7908, y 


. . . . . 7 2 no. 
sin embargo se obtiene mejor ajuste, medido a través de S/, con el modelo cuadrático. 


Figuras 12.21. La magnitud de f, no tiene relación con Ps 


12.14. Una prueba para la hipótesis: ¿es correcto el modelo de línea recta? 
(Error puro y falta de ajuste) 


Una suposición implícita en casi todas las discusiones de este capítulo es que el modelo supuesto, o sea el de 
línea recta, es correcto. Es decir, hemos procedido como si pudiéramos asegurar que Myy = Py + PX. Si la 
. ., e . 2 p 
ecuación de regresión no es de la forma supuesta, una consecuencia inmediata es que S; no es un estimador 


. . 2 2 . . 2 . 
insesgado de 0”, es decir, que E (a ) # 0^, y en ese caso las inferencias basadas en 5; pueden carecer de sentido. 


Esto puede comprenderse mejor si recordamos que el estimador de 0” es: 


Dl ¡P) 


. n—2 


1 
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de modo que para estimar la varianza común a las distribuciones de Y para diferentes valores de X (ver Figura 


12.7) estamos usando los valores Y, ajustados suponiendo un modelo de línea recta. En estas condiciones 


~ KE 
el numerador de S? o sea S.C. ERROR = Sl a ) está integrado por dos componentes. Uno de ellos 


proviene de la variabilidad de la variable independiente Y cuando se observa repetidamente el mismo valor de 
X, y recibe el nombre de Suma de Cuadrados de Error Puro (S.C.E.P.). El otro componente aparece por la falta 
de ajuste de los datos al modelo lineal usado, y puede reducirse usando un modelo alternativo. A éste se le llama 
Suma de Cuadrados de Falta de Ajuste (S.C.F.A.). Tenemos entonces que puede escribirse. 


S.C.ERROR = S.C.E.P + S.C.F.A. (12.40) 


Nótese que, si al menos para un nivel de X se tiene más de una observación, es posible obtener un estimador 
de 0? que es insesgado independientemente del modelo que se ajuste, y ésta es la idea central en la prueba que 
propondremos. En efecto, supóngase que en el experimento se observa la variable independiente en ż niveles, 
digamos X, X)»..., X,» y que la variable dependiente Y se observa n, veces en el primer nivel, m, veces en el 
segundo, etcétera. La estructura de los datos se presenta en la Tabla 12.4. 


Para cada uno de los niveles de X donde hay más de una observación los diferentes valores de Y son una muestra 
aleatoria de una distribución Normal con varianza 0”, de manera que al igual que en el modelo del diseño 
complemente aleatorizado podemos obtener: 


did lA (12.41) 


Donde Y,. es la suma de los valores de para el nivel ¿-ésimo de X, y Y j la media de los mismos. 


Tabla 12.4. Estructura de los datos para un prueba de falta de ajuste. 


Valores distintos Núm. de 
Valo y di 

de X iaiia observaciones (n,) Media 
Xi Yip Yiz» Yin nı Y, = p Y; 

; a 
X, Ya Vaz rn Ya» m Y = 2 Yz; 

2 à > 
X, Y Ya Lia An, y _2Y 

t 


Cada $? es un estimador insesgado de su varianza poblacional, pero como hemos supuesto homogeneidad de 
varianzas, podemos generar el estimador ponderado: 
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Siar- S-S 
s? = i=l = j=l 
R a n—t 


(7, 1) 


2 (12.42) 


i 


que es un estimador insesgado de o° independientemente de la forma de 4y,x. A Se se le llama Cuadrado 


Medio de Error Puro (C.M.E.P,) para destacar que no depende del modelo ajustado. Además, el numerador es 
precisamente la S.C.E.P. de la expresión (12.40), o sea la variabilidad de Y que se debe simplemente a que es 
una variable aleatoria con varianza 07. La S.C.F.A. puede obtenerse fácilmente por diferencia usando (12.40): 


S.C.F.A. =S.C.ERROR —S.C.E.P. 
=D(r-f) -E DS Pp 
La hipótesis de que el modelo de línea recta es correcto puede expresarse como sigue: 
Ho: Uyıy =o +BıX en oposición a Ha: My;x # Po + ÊX 


y para probarla usaremos la descomposición de la S.C. ERROR recién obtenida. Las distribuciones asociadas 
son: 


(n, -1)S7  S.C.E.P 
Za BE x (Ère) 


Además, bajo Ho: 


donde: 
e.1.F.A.=g,1. ERROR — g.l. ERROR PURO = (»—2) 


(Nr, -1)=(1-2)-(n-1)=1-2 


5 i 2 P 2 2 x 
De paso, estos resultados nos permiten verificar que si Ho es cierta, entonces E (s: )= o”. En caso contrario 
se tiene: 


2 [ “vsx, -(ßo +B1X; y 


E(s?)=0? T 
n—=2 (12.44) 


De acuerdo con los resultados anteriores, si definimos el Cuadrado Medio de Falta de Ajuste (C.M.F.A.) como: 


y 
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C.M.F.A.= a 
1-2 (12.45) 
La estadística de prueba F} es: 
C.M.F.A. 
er 
C.M.E.P. 


la cual bajo Ho tiene la distribución F/Z7, por lo que la regla de decisión para una prueba de tamaño € es: 


Rechazar Ho si F, > go 


n—t,a 


Las posibles interpretaciones de la prueba son: 


1. No se rechaza Ho: My ¡y = Po + BX. En este caso la conclusión es que el modelo es adecuado. Como 
en cualquier prueba de hipótesis, ésto no implica que la ecuación de regresión es yy = Py +X, 
sino meramente que los datos son compatibles con esa hipótesis, y por tanto, que el modelo adoptado es 
razonable al nivel de significancia usado. 


2. Se rechaza Ho: My¡x = Pp + $$, X. Esto implica que el modelo no es adecuado para representar la 
tendencia de los datos y que es necesario buscar un modelo alternativo. La prueba no indica de qué 
tipo debe ser el modelo, así que será necesario examinar con mayor cuidado tanto los datos como la 
naturaleza del fenómeno que se estudia. 


Ejemplo 12.18. En varias secciones de este capítulo hemos utilizado los datos de la Tabla 12.1, en los cuales X 
representa el número de empleados en un tipo de supermercado y Y las ventas semanales en cientos de miles de 
pesos. Puesto que para 3 valores de X se tienen dos o más observaciones de Y, podemos llevar a cabo una prueba 
de falta de ajuste. Para el efecto escribimos los datos en el formato de la Tabla 12.4, añadiendo otras columnas 
necesarias. 


Nótese que en realidad sólo las hileras 2, 4 y 6 de la tabla (aquéllas para las cuales hay repeticiones) son necesarias. 
Para el resto tanto los grados de libertad como S7 son cero. Aquí se han exhibido todas para mantener la 
presentación en un nivel completamente general. En cuanto al cálculo de los valores $7, lo ejemplificamos con 
la segunda hilera. En ese caso los valores de Yson Y), =6, Y), =6 y Y,3 =5. Por tanto, Y,, =17 y la varianza 
S; es: 


m.e 
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a e 2 
2 oa 
S =% = 3 = 0.3333 
2 
Valores distintos de X Valores de Y n; 2, =1 Ss (m, —1)S? 
10 4 1 0 0 0 
17 6,6,5 3 2 0.3333 0.6667 
19 9 1 0 0 0 
24 8,12 2 1 8.0000 8.0000 
30 12 1 0 0 0 
32 11,13 2 1 2.0000 2.0000 
36 15 1 0 0 0 
40 16 1 0 0 0 
41 16 1 0 0 0 
43 17 l 0 0 0 
48 20 1 0 0 0 
n=15 n=15=4 S.C.E.P. = 10.6667 


En el ejemplo 12.9 calculamos que, para estos datos: 


S.C. ERROR =18.5561 


con 13(7n— 2) grados de libertad, y de la última columna de la tabla anterior: 
S.C.E.P. =10.6667 

con 4(n— +) grados de libertad. 

De donde: 


S.C.F.A. =18.5561—10.6667 = 7.8894 


con 9(ż— 2) grados de libertad. 
Tenemos entonces que el C.M.E.P es: 


C.M.E.P. = S} = ai 


= 2.6667 


y el C.M.FA. es: 


7.8894 


C.M.F.A. = = 0.8766 
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Por tanto, la estadística F} para probar Ho : Uyy = Po +f,X en oposición a Ha : Uy ¡yx # Po +X es: 


_ 0.8766 


= 2 =0.3287 
o 2.6667 3 


valor para el cual no se rechaza Ho para ninguna & razonable. La conclusión es entonces que el modelo de línea 
recta es apropiado para el caso. 4 


12.15. Importancia de las suposiciones en el modelo de regresión lineal simple 


A lo largo de todo este texto hemos insistido en que la credibilidad de cualquier inferencia realizada utilizando 
la metodología estadística depende fuertemente de que se cumplan las suposiciones bajo las cuales se derivan las 
técnicas usadas. Quizá sea en el caso del análisis de regresión donde más frecuentemente se abusa de los métodos 
estadísticos para justificar ideas preconcebidas de los investigadores. En la sección 12.12 se analizaron algunas 
situaciones donde puede llegarse a conclusiones equivocadas usando una lógica deficiente. En esta sección se 
revisa la importancia de las suposiciones del modelo de regresión lineal simple desde el punto de vista de la 
“robustez” de la inferencia con respecto a las suposiciones. El concepto de cuán robusta es una inferencia en 
relación con las suposiciones que la sustentan se introdujo en la sección 9.11. 


En el modelo de regresión lineal simple las suposiciones básicas son: 
a) Yes una variable aleatoria cuya distribución probabilística depende del valor de X. 


Esta suposición implica que Xes una variable no aleatoria que puede ser controlada por el experimentador, 
y se introdujo con el único propósito de simplificar la presentación. Cuando X es también una variable 
aleatoria, se supone que X y Y tienen una distribución Normal Bivariada, la cual no estudiaremos en este 
libro. Sin embargo, si consideramos a X como la variable que influye sobre Y, y nuestro objetivo es predecir Y 
a partir de los valores de X, las técnicas de análisis son idénticas a las estudiadas en este capítulo. 


b) La ecuación de regresión es una línea recta. 


En nuestra presentación se ilustró cómo utilizar modelos diferentes del de línea recta, a condición de 
que la ecuación de regresión sea lineal en los parámetros. Por añadidura, en la sección 12.14 se presentó 
una técnica para probar la hipótesis de que el modelo propuesto es adecuado, siempre que se tengan 
repeticiones para uno o más valores de la variable independiente. 


c) Homogeneidad de varianzas. 
Esta suposición es tan importante aquí como en el caso del Diseño Completamente Aleatorizado estudiado 


en el capítulo 11. Si no se cumple, las inferencias pueden ser completamente erróneas. En el ejemplo 12.18 
esta suposición debería investigarse usando la prueba de Bartlett presentada en el apéndice 11.4. 


d) Independencia. 


Aquí se supone que los valores de Y y, por tanto, de los errores (€) son independientes. Esta es la más 
importante de todas las suposiciones, ya que si no se cumple, las pruebas de +, el análisis de varianza y 
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los intervalos de confianza no son confiables. Para validar esta suposición existe una gran cantidad de 
técnicas que pueden estudiarse en la referencia 12.1. 


e) Normalidad. 
Afortunadamente las técnicas presentadas son bastante robustas a esta suposición. O sea que el uso de la 
distribución £ de Student en las pruebas de hipótesis o en los intervalos de confianza, o de la distribución 
F en el análisis de varianza, pueden justificarse si los errores tienen una distribución aproximadamente 
Normal. 
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Ejercicios 
12.1. En seguida se presentan datos de tres variables de gran importancia económica en un país. Las 
variables son: 
Y, : petróleo y petroquímica. 
Y, : producción de alimentos, bebidas y tabaco. 
Y, : energía eléctrica. 
Los datos de estas variables se dan como índices a lo largo de 15 años. Todos los datos son porcentajes 


de producción con respecto al año de 1960. La variable Xes 1 para 1961, 2 para 1962,...,15 para 
1975. 


Índices de volumen de la producción industrial en México (1960 = 100 %) 


X (año) Y, Y, Y, 

1 110.9 106.5 105.9 
2 114.3 109.6 117.4 
3 121.2 118.7 136.3 
4 134.2 129.3 159.4 
5 142.8 137.8 176.1 
6 148.9 147.4 195.8 
7 169.1 153:9 A77 
8 183.8 165.1 241.8 
9 195,2 175.9 279:2 
10 214.7 186.6 306.7 
11 221.8 188.0 335.5 
12 241.2 198.1 371.4 
13 247.1 208.2 409.6 
14 284.5 214.6 448.6 
15 309.8 221.9 455.4 


Fuente: Banco de México. 
a) Grafique Y, contra X, y calcule la covarianza y la correlación entre las variables. Interprete su 
diagrama y sus medidas de asociación. 
b) Repita el inciso 4) para las variables Y, y X. 
c) Repita el inciso 4) para las variables Y, y X. 


12.2. En los diagramas de dispersión del ejercicio 12.1, dibuje en cada caso la recta que a su juicio representa 
mejor a los datos. De sus dibujos estime gráficamente las constantes de cada recta. 


123, 


12.4. 


12:5. 
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En el cultivo de tejidos in vitro se ha observado que si se colocan dos núcleos de crecimiento en el 
mismo cultivo, a menudo el crecimiento se organiza formando un patrón alrededor del eje entre los 
núcleos. A esto se le llama un campo de atracción. Se ha observado que los campos de atracción se 
forman con mayor frecuencia si los núcleos están cercanos. En un experimento (Science, Vol. 114, 
pág 131, 26 de octubre de 1951) se colocaron núcleos a 20 distancias diferentes, y cada distancia se 
repitió un número variable de veces, registrando el número de campos formados en cada distancia. 
Los resultados se presentan enseguida. 


Distancia entre , ; Campos de Incidencia = campos/ 
núcleos (mm) Núm. de cultivos atracción núm. de cultivos 
0. 48 48 1.00 
0.4 51 49 0.96 
0.6 50 48 0.96 
0.8 52 48 0.92 
1.0 51 46 0.90 
1.2 52 46 0.88 
1.4 39 33 0.85 
1.6 42 34 0.81 
1.8 40 28 0.70 
2.0 48 36 0.75 
2.2 42 26 0.62 
2.4 49 28 0.57 
2.6 36 20 0.56 
2.8 49 22 0.45 
3.0 40 12 0.30 
32 38 14 0.37 
3.4 40 8 0.20 
3.6 42 2 0.05 
3.8 46 0 0.00 


4.0 38 0 0.00 
— a > ARA 


Sean X = distancia entre núcleos y Y la incidencia de campos de atracción para las diferentes 
distancias. Dibuje el diagrama de dispersión de los datos y la recta que a simple vista se ajusta mejor a 
ellos. De su dibujo estime los parámetros de la recta ajustada. ¿Observa alguna anomalía en el ajuste? 
¿Qué tipo de asociación muestran X y Y Verifíquelo calculando rxy. 


En los datos del ejercicio 12.1 calcule las rectas estimadas de regresión de Y, contra X, Y, contra X y 
Y, contra X. Compare los resultados con los obtenidos gráficamente en 12.2. 


Desde un punto de vista meramente descriptivo, interprete los coeficientes Êo y Ê, estimados para 


cada recta en 12.4. ¿Qué sentido tiene bo en cada caso? Note que el valor de Y para X = 0 (año de 
1960) es conocido en estos datos, y es 100 en las 3 variables. 


MeroDos ESTADÍSTICOS 
Infante-Gil y Zárate de Lara 


12.6. 


12:7: 


12.8. 


12.9; 


12.10. 


12.11, 


= UN ENFOQUE INTERDISCIPLINARIO 


Para los datos del ejercicio 12.3 encuentre la recta de mínimos cuadrados e interprete sus resultados. 


¿Tiene sentido interpretar f en este caso? ¿Tiene sentido estimar Y para X muy grandes (mayores de 
5, por ejemplo)? 


Usando los resultados del ejercicio 12.6 calcule la S.C.E. o Suma de cuadrados de residuales 
20 5 
directamente de la definición. Es decir, calcule > (y, nd y Verifique que, salvo errores de 
i=l 
20 n a i 
redondeo, > cl ) = 0, o lo que es lo mismo: Y = Y . Trate de probar este resultado en general. 


i=l 


Con los datos del ejercicio 12.1, y usando sus resultados en 12.4, para cada una de las rectas ajustadas 
haga lo siguiente: 


a) Calcule S.C. ERROR usando la expresión abreviada (12.19). Obtenga también 5 


b) Encuentre Sa, Sa, ; Sa, y Sa z 


c) Encuentre intervalos de confianza al 99% para f, y al 90% para ĝo. 


d) Usando los resultados de c) decida en cada caso si se rechaza Ho: ff, =0 en oposición a 
Ha: P, #0. (a =0.01). 


e) Decida si se rechaza Ho: $, =100 en oposición a Ha: Po 4100. (a = 0.10). 


Para los datos del ejercicio 12.3, y usando sus resultados en 12.6, haga lo siguiente: 


a) Intervalos de confianza para fọ y P,. (œ = 0.02) ¿Por qué es más ancho el intervalo para $, que 
para $? ¿Ocurrirá esto siempre? 


b) Pruebe Ho: p, >—0.20 en oposición a Ha: $, <—0.20. (a = 0.01). Interprete el resultado. 


Presente la tabla de A de V para la regresión de Y, contra X en el ejercicio 12.1. Use la tabla para 
probar Ho: p, =0 en oposición a Ha: p, #0. Pruebe la misma hipótesis usando una prueba de +. 
Use a = 0.01. Compare to y Fo. 


En un experimento (Science, vol. 80, núm. 206, pág. 168, 17 de agosto de 1934) se trató de determinar 
el tiempo durante el cual la madera seca absorbe agua. Para ese fin se eligió una pieza de madera del 
género Picea y se le mantuvo sumergida en agua durante un total de 280 días, pesando la madera 
a diferentes tiempos para determinar la cantidad de agua absorbida. Los resultados se presentan en 
seguida. 


12:12. 


12.13. 


12.14. 
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q 


Tiempo de inmersión (días) X 0.007 0.02 0.03 0.06 0.10 0.14 0.27 
Agua absorbida (gm) Y 2.16 2.49 2.92 3.94 4.58 5.10 6.20 


X 1.25 2.25 3.25 4.25 10.25 15 27 43 

Y 8.27 9.44 11.09 12.58 16.78 17.30 20.11 23.36 
X 59 90 125 161 193 253 280 

Y 24.25 28.86 31.70 33.53 34.69 35.44 35.49 


a) Calcule la tabla de A de V para el modelo de línea recta, y con ella pruebe Ho: f, =0 en 
oposición a Ha: PB, #0. (a = 0.01). Interprete su resultado. 


b) Calcule intervalos de confianza para fo y ĝi 
c) De su intervalo en $) decida si fọ 4 0. (a = 0.01). 


d) Pruebe que la cantidad de agua promedio absorbida por día es mayor de 0.1 g. Es decir, pruebe 
Ho: f$, <0.1 en oposición a Ha: f, >0.1. a = 0.05. 


Con respecto a los datos del ejercicio 12.11 parece razonable, por la naturaleza del fenómeno, 
proponer un modelo con $, = 0. Use los datos para ajustar el modelo: 


Y =BX te d= Lct 


a) Presente la tabla de A de V para el modelo con fB, = 0, y pruebe Ho: Bj =0 en oposición a 
Ha: Pi #0. (a = 0.01). 


b) De la comparación de los cuadrados medios del error parece evidente que el modelo con $, = 
0 no es mejor modelo que el ajustado en el ejercicio 12.11. Dibuje el diagrama de dispersión 
de los datos y, en él, las rectas ajustadas con y sin ordenada al origen. ¿Parece que alguno de los 
dos es un buen modelo? ¿Cuál es el problema? 


Con los datos del ejercicio 12.11 dibuje el diagrama de dispersión de Y contra logaritmo natural de 
X. ¿Parece ser más lineal la relación entre Y y X? Ajuste a los datos el modelo Y = Ba +BiZ+e, 
donde Z = ln X. Grafique la nueva recta ajustada en el diagrama de dispersión en 12.12 6) y en el 
diagrama de dispersión de Y contra X. ¿Cuál de los 3 modelos parece ser el mejor? Compare también 
los cuadrados medios del error. 


En el ejercicio 12.3 se presentaron datos de las variables Y y X, donde X es la distancia entre dos 
núcleos en un cultivo y Y es la incidencia de campos de atracción para una distancia dada. En el 
ejercicio 12.6 se ajustó la recta de mínimos cuadrados, y en 12.7 se calcularon los 20 residuales del 
modelo de línea recta Y = o + P,X +e. Ver también 12.9. 


a) Examine el diagrama de dispersión de los datos y los residuales. Note la curvatura de los puntos 
en el diagrama de dispersión y el hecho de que los primeros 4 residuales son negativos (Y, < Y, ), 
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luego hay 10 residuales positivos (y, >F ), y los 4 últimos son negativos. Todo esto sugiere una 
relación cuadrática entre Y y X. 


b) Ajuste el modelo Y = 8, +81 Z +e, donde Z = X°. Presente el A de V del modelo y pruebe 
Ho: Bi = 0 en oposición a Ha: Bi 0. (a =0.01). 


c) En el diagrama de dispersión de los datos (Y contra X ) dibuje las ecuaciones de mínimos 


cuadrados Y = Bo +, X y Y = P, +Ê Xæ. ¿Cuál da el mejor ajuste? Compare los C.M.E. de 
los dos modelos. 


d) Dibuje el diagrama de dispersión de Y contra X?, y en el mismo la recta ajustada Y = P, + B, Je, 
¿Parece bueno el ajuste? 


e) Decida cuál de los dos modelos debe usarse, dada la evidencia, para representar la relación entre 


Y y X. 


12.15. En un experimento con conejos se hizo variar la cantidad de alimento administrado, y además se les 
añadió 1 g diario de colesterol en la dieta durante varias semanas. La cantidad de alimento X está 
expresada como gramos diarios por kg de peso al inicio del experimento. Entre otras variables, se 
midieron las siguientes: 


Y: Proporción del peso final al peso inicial. 
Y,: Colesterol al final del experimento (en mg). 


Los datos se presentan a continuación (Fuente: Science, 13 de enero de 1950, pág. 32): 


E f È 
10 0.91 313 
15 0.88 370 
18 090 424 
19 079 356 
20 094 310 
21 0.88 349 
21 0.95 365 
24 097 245 
25 088 373 
27 101 395 
28 0.95 156 
30 0.95 243 
30 105 150 
31 1.05 463 


É Y, A 
33 116 677 
35 0.96 151 
36 1.08 280 
37 113 25 
39 100 39% 
422. 110 278 
45 111 297 
54 118 224 
56 126 346 
56 129 141 
59 136 139 
59 140 424 
60 132 316 
64 147 37 


a) Dibuje diagramas de dispersión de los datos para Y, contra Xy para Y, contra X. 


.. 


12.16. 


12.17. 
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b) Calcule las rectas de mínimos cuadrados para Y, contra Xy Y, contra X. Dibújelas en los diagramas 
de dispersión correspondientes. ¿Cómo aparece el ajuste en cada caso? 


c) Presente las tablas de A de V, tanto para Y, como para Y), y en ambos casos pruebe la hipótesis de 
que la pendiente es cero. (æ = 0.01). 


d) Calcule tanto para Y, como para Y, la desviación estándar del estimador de la pendiente. Compare, 


para cada una de las variables, $, con S} . ¿Puede explicar mediante esta comparación por qué se 


P, 


concluye que f; es diferente de cero para la variable Y,, y que no lo es para la variable Y,? 


as b 


A aS 
e) Sea f; = g A PB se le llama el estimador del coeficiente de regresión estandarizado. Calcule f, 
b, m 
para Y, y para Y, ¿Porqué es importante E 


De los datos presentados en el ejercicio 12.15 considere la variable independiente X (g diarios de 
alimento por kg de peso inicial) y la variable dependiente Y, (proporción del peso final al peso 
inicial). Para estas dos variables el modelo de línea recta parece razonable. En caso de que no haya 
trabajado el ejercicio 12.15 puede partir de aquí, calculando las estadísticas para la regresión de Y, 
contra X. 


a) Calcule las predicciones Y x, Para los siguientes valores de X) : 0, 5, 15, 25, 30, 35.5, 39, 45, 60, 


70,80, 90. Calcule también S; , intervalos de confianza al 99% para y, x, , y la anchura de cada 
intervalo. di 


b) Dibuje la banda de confianza para la recta de regresión estimada. 10: = 0.99. 
c) Pruebe Ho : Uy ,x=90 =1.7 en oposición a Ha: Uy¡x=9p 41.7, con a = 0.01. 
En un experimento se estudió el efecto de la exposición a la luz sobre la actividad de una enzima 
(%-amilasa). La variable independiente (X) son horas de exposición, y la variable dependiente (Y) es 


la actividad enzimática relativa (en porcentaje), con respecto a cero horas de exposición. Los datos se 
dan a continuación: 


Tiempo de exposición Actividad enzimática relativa 


(X) (Y) 
0 100 
0.167 87 
0.500 71 
1 52 
2 30 
3 15 
4 10 
5 4 


Fuente: Science, Vol. 109, pág. 486, 13 de mayo de 1949. 
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12.18. 


12.19 


UN ENFOQUE INTERDISCIPLINARIO 


a) Dibuje el diagrama de dispersión de los datos y calcule la recta de mínimos cuadrados. Dibuje la 
recta en el diagrama. 


b) De consideraciones teóricas se espera que la relación lineal se dé entre 
Z =log Y yX 


Calcule la recta de mínimos cuadrados para Z contra Xy dibújela en el diagrama de dispersión de 
Xy Z. 


c) Calcule las tablas de A de V de las regresiones de Y contra X y Z contra X. ¿Cuál de las dos rectas 
da mejor ajuste? ¿Es válido comparar los C.M.E. para las dos situaciones? ¿Los coeficientes de 
variación? 


(Residuales y predicción). Considere los datos del ejercicio 12.11 para efectos de predicción. Allí se 

ajustó el modelo Y, = o + fP,X; +€;, y en 12.13 se ajustó el modelo Y, = PB, +; ln X; +€,. 

a) Calcule y compare los coeficientes de determinación y los coeficientes de correlación en los dos 
modelos. ¿Cuál es el mejor modelo de acuerdo con esta comparación? Compare también los 
coeficientes de variación. 


b) Calcule los residuales para cada uno de los modelos. Verifique con ellos los valores de S.C. 
ERROR. ¿Observa alguna anomalía en los residuales? ¿Alguno de los modelos predice bien? 


c) Con cada uno de los dos modelos calcule predicciones para X, = 10.25, 59 y 400. Calcule los 
intervalos de confianza para My x, . Para calcular los intervalos de confianza en el segundo modelo 
debe transformar las X; a Z; = In X;, y usar los resultados del ejercicio 12.13. 


d) ¿Confirman los resultados del inciso c) la idea de que el modelo con In X es mejor predictor? 


(Predicción en modelos con la variable dependiente transformada). En el ejercicio 12.18 consideramos 
la predicción para un modelo Y = f, + fB; In X +e sin encontrar ningún problema. La situación 
es diferente cuando se analiza una función de la variable dependiente Y. Considere los datos del 
ejercicio 12.17, donde X es el número de horas de exposición a la luz de una enzima y Y es la 
actividad de ésta. 


a) Para el modelo Y = fo +f$,X+e pronostique el valor de 4y,x,, para Xy =3 y Xo =5.2. 
Calcule intervalos de confianza al 99% para las predicciones. 


b) Repita el inciso a) para el modelo log, ,Y = Z =P, +fP,X+e. 


c) Dado que es mejor el modelo que usa a log; Y como variable dependiente, es natural querer 
usarlo para inferir sobre la actividad enzimática relativa. El problema es que, aun si las 
suposiciones del modelo de regresión lineal simple se cumplen, los intervalos calculados en $) 
son para Z = log Y, y no para Y. Una solución usada frecuentemente consiste (puesto que 
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si Z =log,¿Y, entonces 10% =Y) en tomar como límites de confianza para Uyy a 10% y 
10%, donde L y L son los límites de confianza para 4 7, y . Use esta solución para encontrar 
límites de confianza para yy =3 y My;y =5.2 mediante el modelo Z = fọ +fP$¡X+e y 


los resultados del inciso $). Hay problemas teóricos con esta solución, pero de cualquier modo 
es la más usada. 


d) Compare los intervalos obtenidos en el inciso c) con los del inciso a). 


12.20. Considere de nuevo los datos del ejercicio 12.15, y en ellos a la variable dependiente Y, (proporción 
del peso final al peso inicial) y a la variable independiente X (g diarios de alimento por kg de peso 
inicial). Se tienen repeticiones para X= 21, 30, 56 y 59. Haga una prueba de falta de ajuste para el 
modelo de línea recta Y, = fo + PB, X +e. Use a = 0.05. 
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Algunas técnicas no paramétricas 


13.1. Consideraciones generales 


Como es fácil verificar mediante un repaso somero del contenido de los capítulos anteriores, una característica 
común a las técnicas de inferencia que hemos discutido es en que en todas ellas se ha supuesto una función 
de probabilidades para las variables aleatorias que integran la muestra. Más aún, es casi inevitable que el 
modelo probabilístico que se adopte sea el Normal, o que termine usándose éste invocando al Teorema 
Central del Límite. Mientras que en muchos casos la suposición se justifica, en muchos otros es claramente 
absurda. Las técnicas que se estudiarán en este capítulo se caracterizan porque su aplicación no depende de 
un modelo probabilístico específico, sino que son válidas bajo condiciones distribucionales muy amplias. 
Por esta razón las técnicas que ahora estudiaremos pueden llamarse independientes de la distribución, que es 
el nombre con el que algunos autores las identifican. El otro nombre, que es el que usaremos aquí, es el de 
Técnicas No Paramétricas, y se deriva del hecho de que en este conjunto de métodos no es indispensable que las 


r , è Ta SE t > A . 2 
observaciones se modelen en términos de una familia paramétrica de distribuciones, por ejemplo, N(uo ). 
Aquí las llamaremos Técnicas No Paramétricas en atención a la popularidad de este nombre, aunque quizá sea 
más adecuado el primero. 


Otro aspecto de las técnicas de inferencia de los capítulos anteriores, que en lo sucesivo llamaremos Paramétricas 
por oposición a las que nos ocuparán en el presente capítulo, es que invariablemente hacen uso de la(s) media(s) 
y la(s) varianza(s) muestral(es). Esto, aunque no se mencionó antes, puede ser una limitación severa al uso de las 
técnicas paramétricas, ya que el cálculo de las estadísticas y y e requiere realizar operaciones aritméticas tales 
como la suma y el producto con los elementos de la muestra. En muchos experimentos los datos que se obtienen 
no admiten la operación de suma, como puede verse en el siguiente ejemplo. 


Ejemplo 13.1. En una encuesta para estudiar el grado de religiosidad de un población rural se tomaron dos 
muestras, una de campesinos y otra de empleados. Las muestras son de tamaños 10 y 8, respectivamente. Ahora 
bien, medir la religiosidad de una persona es claramente más complicado que medir (digamos) la estatura, por 
lo que el investigador hace una serie de preguntas a cada entrevistado, y de acuerdo con las respuestas le asigna 
uno de cinco distintos grados de religiosidad que son, en orden ascendente: 


-E 
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Fanático antirreligioso (jacobino) (7) 
Moderadamente opuesto a la religión (O) 
Indiferente (1) 
Moderadamente religioso (R) 
Fanático religioso (F) 


Los resultados del experimento, con la codificación previa, son eventos del espacio muestral M =(/,0, 1, R, F). 
Las muestras obtenidas son: 


Campesinos: R, 1, R, O, R, F, R, R, F, F. 
Empleados: /, Z, O, J, R, R, 1, I. 


Si queremos analizar este experimento con la única técnica de que ahora disponemos, es decir, mediante la 
prueba de £ para dos muestras independientes (el A de V usando F sería equivalente), requerimos las medias y 
varianzas muestrales, y es claro que no sabemos (por ejemplo) cuánto es J +0, es decir, que no sabemos realizar 
sumas con los elementos de las muestras. 4 


El experimento descrito en el ejemplo anterior es representativo de los que se analizarán con las nuevas técnicas en 
las siguientes secciones. Además de que no es posible calcular las medias y varianzas para el análisis paramétrico, la 
suposición de normalidad es disparatada, si no por alguna otra razón, porque la religiosidad se mide en una escala 
con discontinuidades muy bruscas. En otras situaciones, aunque la respuesta se mide en escalas razonablemente 
continuas, el modelo Normal no es adecuado, ya sea porque la distribución de frecuencias es muy asimétrica o 
porque concentra demasiado peso en las colas. En cualquiera de estos casos, si operamos bajo el modelo Normal 
(sobre todo con muestras pequeñas), los niveles reales de error serán muy distintos (mayores) que los especificados 
por nosotros mediante el nivel de significancia (4) de un prueba o el nivel de confianza (1— æ) de un intervalo. 


Volviendo al ejemplo 13.1, es frecuente que investigadores con poco entrenamiento estadístico decidan definir 
variables aleatorias que toman valores numéricos arbitrarios; por ejemplo, la variable 


X(J)=1, X(0)=2, X(1)=3, X(R)=4 y X(F)=5 


basados en que, por lo que toca al grado de religiosidad, a J le corresponde una calificación menor que a O, a O 
menor que a /, etc. La asignación de estos números es correcta, siempre que tengamos presente que los números 
implican meramente un ordenamiento de las observaciones. El error en que incurren algunos experimentadores 
consiste en usar la “nueva” variable aleatoria (que ahora toma valores enteros entre 1 y 5) para calcular medias 
y varianzas y proceder con el análisis paramétrico. Este procedimiento es un truco que podemos calificar de 
autoengaño, ya que las “nuevas” observaciones no pueden contener más información que las originales. 


Las consideraciones anteriores han sido hechas con el propósito de que el lector se percate de que existen 
diferentes niveles de precisión en la medición de una respuesta, ya que los diferentes niveles condicionan 
las operaciones aritméticas que pueden realizarse con las observaciones y, por ende, determinan los métodos 
estadísticos que pueden usarse para analizarlas. 


En la siguiente sección se hará una clasificación de las Escalas (Niveles) de Medición más comúnmente usadas. 
Comprender sus características es indispensable para aplicar correctamente los procedimientos que se presentarán 
a partir de la sección 13.3, por lo que recomendamos se lea con atención. 
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ALGUNAS TÉCNICAS NO PARAMÉTRICAS 


Antes de pasar al siguiente tema señalamos que en este capítulo presentaremos técnicas alternativas para muchas 
situaciones discutidas en los capítulos previos, en un número de páginas mucho menor. Por esta razón los 
métodos serán presentados de manera un tanto esquemática, y en un orden que no necesariamente es el más 
conveniente desde el punto de vista didáctico. Incluir este capítulo en un libro de métodos estadísticos que 
dedica casi toda su atención a las técnicas paramétricas tiene como propósito principal indicar al lector la 
existencia de técnicas cuyas suposiciones son menos restrictivas, pero no pretende usurpar el lugar de un texto 
de métodos estadísticos no paramétricos. A pesar de lo anterior, los autores confían (esperan, desean) que los 
lectores puedan usar con provecho los métodos que se describen de la sección 13.3 en adelante. 


13.2. Escalas de medición 


En seguida caracterizamos someramente las cuatro escalas de medición más frecuentemente usadas, que reciben 
los nombres de: Nominal, Ordinal, de Intervalo y de Proporción. Una discusión más amplia puede encontrarse en 
las referencias 13.1 y 13.2 (páginas 13-33). 


Escala Nominal. En esta escala lo único que puede decirse de una observación es a cuál de un cierto número de 
categorías pertenece. Un ejemplo típico de datos en esta escala son las observaciones de una variable aleatoria 
Bernoulli, donde hay las categorías éxito y fracaso. Otro ejemplo se tiene si se pregunta a una persona cuál de los 
colores primarios es su favorito. En este caso cada color primario es una categoría (también se les llama clases). 


La única relación que puede establecerse entre observaciones medidas en esta escala es la de igualdad (y por 
tanto la de desigualdad). Dos observaciones son iguales si están en la misma clase, y diferentes si no lo están. 
Como consecuencia de lo anterior, la única estadística válida para este tipo de datos es la frecuencia de cada clase. 
Nótese que si se tienen variables aleatorias Bernoulli (X;,..., X, ) y se define X, =1 si pertenece a la clase que 
llamamos éxito, la variable X = X, +--+ X,, , que es Binomial, representa simplemente la frecuencia absoluta 
de la clase “éxito”, y ésa es la única razón por la que se asignaron los números uno y cero a las clases éxito y 
fracaso. En general, en una escala Nominal la asignación de números a las clases puede conducir a errores, a 
menos que recordemos que los números son arbitrarios y no tienen ninguna relación de orden entre ellos. 


Escala Ordinal. Las observaciones medidas en esta escala pueden ordenarse de menor a mayor, y en consecuencia 
no sólo admiten la relación de igualdad, sino además la de “mayor que” (y “menor que”). Las observaciones del 
ejemplo 13.1 están en escala Ordinal, ya que / <O < I< R< F. Además, las observaciones en el primer y 
tercer campesino son iguales, mientras que las del primero y segundo son distintas (R > Z), etc. 


Muchos de los experimentos realizados en las ciencias sociales generan observaciones medidas en esta escala, 
debido a las dificultades para medir actitudes en los seres humanos. Otros ejemplos de esta escala los tenemos 
en las jerarquías eclesiásticas y militares. 


Con observaciones en la escala Ordinal pueden calcularse frecuencias como en la Nominal, pero además puede 
calcularse la mediana de una muestra, ya que las observaciones son ordenables. 
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Escala de Intervalo. Con observaciones en esta escala no sólo pueden ordenarse las observaciones, sino que 
además puede definirse una unidad de distancia (si bien arbitraria) entre ellas. Puesto que una unidad de 
distancia requiere de un cero, es indispensable que exista un cero en la escala. La principal diferencia de esta 
escala con la de Proporción es que en la escala de Intervalo el cero y la unidad de distancia son arbitrarios y, en 
particular, el cero no corresponde a una característica física de las unidades medidas. 


El ejemplo clásico de una característica medida en escala de Intervalo es la temperatura, donde es claro que tanto 
el cero como la unidad de distancia (un grado) son arbitrarios, como el lector puede verificar comparando los 
sistemas Fahrenheit y Celsius. 


Puesto que los requisitos indispensables para efectuar sumas y productos son que existan un cero y una unidad de 
distancia, con las observaciones en esta escala pueden calcularse la media y la varianza, además de las estadísticas 
obtenibles con las escalas previas. Es ésta, entonces, una escala más fuerte que la ordinal, así como ésta es más 
fuerte que la Nominal. 


Escala de Proporción. En esta escala las observaciones pueden ordenarse y existen un cero y una unidad de 
distancia que son inherentes al sistema, es decir, que no son arbitrarios. Ejemplos de características medidas 
en esta escala son el peso de un individuo, el rendimiento por hectárea de una planta, etc. Ésta es la escala más 
fuerte de las cuatro consideradas, y por tanto permite el cálculo de medias y varianzas y de cualquier estadística 
calculable en las otras escalas, 


Casi todas las técnicas de los capítulos anteriores requieren una escala al menos de Intervalo. 


13.3. La prueba de Mann y Whitney para dos muestras independientes. 
Intervalos de confianza 


La primera técnica no paramétrica que presentaremos es muy útil para comparar dos poblaciones usando 
muestras independientes cuando la escala es al menos Ordinal. El hecho de que la prueba sólo requiera escala 
Ordinal y no suponga ningún modelo probabilístico para las observaciones ilustra dramáticamente su rango de 
aplicación, en contraste con la prueba de + explicada en la sección 10.3. 
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La prueba de Mann y Whitney fue propuesta originalmente por F Wilcoxon 
considerando dos muestras de igual tamaño. Posteriormente, los autores bajo cuyos 
nombres ha venido a ser más conocida la generalizaron para tamaños distintos de 
muestra, y generaron las primeras tablas de puntos críticos para la prueba. La 
razón de que iniciemos nuestra presentación con una técnica no paramétrica para 
dos muestras independientes es que la técnica no paramétrica más útil para una 
sola muestra será derivada como una simplificación de la propuesta para dos 
muestras apareadas, con lo que invertimos el orden seguido en los métodos 
paramétricos. 


La estructura de los datos es idéntica a la presentada en la técnica paramétrica. 
Es decir, que se tienen muestras aleatorias de dos poblaciones cuyos elementos 


denotamos por Frank Wilcoxon 
1892-1965 


Muestra de Población 1:  X, X>- Xn 
Muestra de Población 2: Y}, Y,..., Y, 


n 


Las dos muestras son independientes, o sea que existe independencia entre y dentro de las muestras. Las 
suposiciones necesarias para usar correctamente la prueba se presentan en el siguiente recuadro. 


Las hipótesis que pueden plantearse con esta prueba se formulan de distintas maneras en la literatura 

estadística. Aquí optaremos por las que tienen la interpretación más sencilla. Puesto que la escala es Ordinal y 

puede calcularse la mediana de cada muestra, la hipótesis propuesta involucra las medianas de las poblaciones 

que se desea comparar. Sean X y Y las variables aleatorias que sirven de modelo para las poblaciones, y sean 

Myy My las medianas respectivas. Siguiendo la rutina que ya hemos establecido, tenemos tres posibles juegos 
a 8 que 

de hipótesis: 


a) Ho: My = My en oposición a Ha: My + My 
b) Ho: My < My en oposición a Ha: My > My 
c) Ho: My > My en oposición a Ha: My < My 


Para derivar una estadística de prueba recordamos que la mediana es parámetro de localización, y que la 
única relación que puede establecerse entre observaciones registradas en escala Ordinal es el ordenamiento 
por magnitud. Si ordenamos a las 2 +» observaciones de las dos muestras de acuerdo con su valor, pueden 
obtenerse muy diversos ordenamientos. Sin embargo, si suponemos que My = My, cabe esperar que las 
observaciones de las dos muestras se encuentren más o menos uniformemente mezcladas. En cambio, si 
al colocar a las n+m observaciones en orden ascendente encontramos que los elementos de una muestra 
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ocupan las posiciones superiores, es lógico pensar que la población de la que se extrajo esa muestra tiene su 
distribución de frecuencias concentrada en valores mayores que la otra población o, en términos de nuestras 
hipótesis, que tiene mayor mediana. Para ilustrar lo anterior presentamos un diagrama con los datos del 
ejemplo 13.1. 


e c 
e c 
e c G 
Grado de 
Y e c 
religiosidad 
e c c c c 
J O I R F 


Figura 13.1. Gráfica del ordenamiento de las dos muestras con escala ordinal. 


La gráfica 13.1 nos proporciona evidencia de que la población de campesinos está desplazada a la derecha de la 
de empleados por lo que toca a su religiosidad. 


Toda la lógica de la prueba de Mann y Whitney está basada en el ordenamiento ejemplificado en la Figura 
y jemp 8 
13.1, y sólo nos resta resumir la información desplegada en el ordenamiento gráfico en una estadística de 
prueba que pueda usarse para obtener reglas de decisión con niveles de significancia preestablecidos. Para tal 
fin definimos el “rango” de una observación como el lugar que le corresponde en el ordenamiento de todas 
q 
las observaciones. Aquí, el término rango se usa en sentido jerárquico, ya que una observación tiene más 
8 jerarq ya q 
rango que otra si es mayor numéricamente. Toda la información que una muestra contiene se sintetiza en la 
suma de los rangos de sus integrantes. Es decir, que para la muestra X;,..., X, obtenemos R(X; ),..., R(X, ), 


que son los rangos respectivos y además la estadística S, = pY R(X;). Es claro que un valor grande de S, 


apoya la hipótesis de que My es mayor que Myy, además, dada la naturaleza ordinal de las mediciones, toda 
la información pertinente sobre la mediana de X se concentra en $, de la misma manera que X tiene la 
información pertinente sobre 4 cuando se tienen escalas más fuertes. En el siguiente ejemplo ilustramos el 
cálculo de las estadísticas recién descritas. 


Ejemplo 13.2. Suponga que se tienen muestras aleatorias de dos poblaciones cuyos modelos probabilísticos se 
identifican mediante los nombres de las variables X y Y. Las observaciones son: 


Xx: 9,8, 12,7, 10, 15, 11, 19,2, 23 
Y: 0,14,6,1,20,5,3 


Para asignar rangos a las observaciones y calcular $, proponemos la siguiente tabla. 
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S,=106 $S.=4 4 


En la tabla del ejemplo 13.2 se calculó S, = ZRO ), pero se calculó además S_ = ya R(Y, ). Las estadísticas 
= jsl 

S, y S_ juegan el papel de las medias X y Y en las técnicas paramétricas, sólo que en este caso no es necesario 

calcular ambas, ya que la suma de S, y S_ es una cantidad fija dados los tamaños de muestra » y m. En efecto, 

es claro que S} + S_ es la suma de los primeros n + m enteros positivos. En el ejemplo 13.2, n + m = 17, por 

lo que S, +S_ =1+2+--+17 =153. La suma de los primeros k enteros positivos es fácil de obtener mediante 


la siguiente expresión: 


¡=14+24+-+%k-1+%= 
| (13.1) 


Ms 


k(k +1) 
2 


1 


La prueba de (13.1) se propone como ejercicio al final del capítulo. Por lo pronto es claro que la suma de S, y 
S_ en el ejemplo es la suma de los primeros 17 enteros positivos, es decir, que: 


17X18 
S,+S_= A =153 


Esta relación entre S, y S_ hace innecesario el cálculo de ambos, ya que la suma está fija por los tamaños de 
las muestras. La distribución de S, bajo la hipótesis nula es sencilla de calcular, y en la Tabla J se presentan 
valores críticos para realizar pruebas a los niveles de significancia más usuales. Con objeto de ilustrar cómo se ha 
calculado la Tabla J presentamos el siguiente ejemplo. 


Ejemplo 13.3. Suponga que se tienen muestras aleatorias independientes (1,25) y (Far ), es decir 


6Y (6 
que n = 2 y m = 4. Los posibles ordenamientos de las 6 observaciones son en total e = | A =15 y, bajo 
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la hipótesis My = My, cada arreglo tiene la misma probabilidad (11/15). En seguida se listan las 15 posibles 
combinaciones de rangos para X, y X,, ordenadas de acuerdo con el valor de S,.. 


Rangos de X, y X% Sy Probabilidad 
12 3 1/15 
159 4 1/15 
1,4 5 1/15 
2,33 5 1/15 
BS 6 1/15 
2,4 6 1/15 
1,6 Y 1/15 
Z5 7 1/15 
3,4 7 1/15 
2,6 8 1/15 
3,5 8 1/15 
3,6 9 1/15 
4,5 9 1/15 
4,6 10 1/15 
5,6 11 1/15 

1.00 


En forma de tabla la distribución de S, es: 


Tabla 13.1. Distribución (bajo Ho) de S, para n = 2 y m = 4. 


3 4 5 6 7 8 9 11 


1/15 1/15 2115 215 345 2/15 2/15 1/15 1/15 


4 


Con la distribución de S, bajo Ho no es difícil deducir las reglas de decisión para las hipótesis a), b) y c). Por 
ejemplo, para el juego de hipótesis: 


Ho: My S My en oposición a Ha: My > My 
es lógico rechazar Ho si S, es “grande”. ¿Qué tan “grande”? depende del nivel de significancia que se desee. 


Así, las reglas de decisión que se presentan en seguida tienen los niveles de significancia que se muestran para la 
hipótesis considerada y tamaños de muestra n = 2 y m = 4 (ver Tabla 13.1). 


Regla de decisión a 
Rechazar Ho si S, >11. 1/15 = 0.067 
Rechazar Ho si S, >10. 2/15 = 0.133 


Rechazar Ho si S, >9. 4/15 = 0.267 


Capítulo 13 


ALGUNAS TÉCNICAS NO PARAMÉTRICAS 


Con la misma lógica pueden establecerse reglas de decisión para Ho: Mx =M, en oposición a 
Ha: My < My, y entonces las regiones de rechazo corresponderían a valores pequeños de S4 (valores grandes 
de S_). En cuanto a la hipótesis de dos colas Ho: My = My en oposición a Ha: My + My, se rechazaría 
Ho para valores muy grandes o muy pequeños de S4. A este respecto hacemos notar que la distribución de 
S, es simétrica, por lo que se tienen las mismas simplificaciones que en una prueba de Z o en una prueba de 
ten los métodos paramétricos. 


Antes de sintetizar el procedimiento para una prueba de Mann y Whitney utilizando la tabla J, es necesario 
hacer las siguientes aclaraciones: 


a) 


b) 


c) 


En la tabla J no se presentan valores críticos de la estadística S}, sino de la estadística: 


nin+1) 


¡A A 
te g (13.2) 


que es una transformación trivial de S}, y cuya única particularidad es que tiene una media y una 
varianza que son más sencillas de memorizar que las de S,, hecho que usaremos posteriormente. Por 


ka e sel nin+1) 
otra parte, es fácil verificar que S} puede tomar como valores extremos los enteros positivos === 


2 
n +2nm+n , e 
, o sea que va de 3 a 11 en el ejemplo 13.3, mientras que 7}, toma como valores extremos 


los enteros 0 y 2m, o sea 0 y 8 en el ejemplo 13.3. Es por estas razones que se prefiere la estadística T}. 


La segunda aclaración tiene que ver con los niveles de significancia declarados en la tabla J. Supongamos 
que en el ejemplo 13.3 planteamos la hipótesis Ho: My S My en oposición a Ha: My > My. La 
región de rechazo corresponde a valores grandes de S} (o de T}). Considérese la regla de decisión: 
“Rechazar Ho si S, >11” El nivel de significancia para esta prueba es; 


a= P(S, >11|M, =M,)=?P(T, >8|My =My)=5=0.067, 


de acuerdo con la Tabla 13.1. En la tabla J, para n = 2 y m = 4, en la hilera con æ = 0.10 aparece el 
valor siete. Esto quiere decir que con 4 = 0.10 debemos rechazar Ho si T, >7, es decir, si T, 28 o 
S, >11. O sea que la prueba con la regla de decisión propuesta tiene un nivel de significancia de 0.10 
de acuerdo con la tabla J, mientras que nosotros hemos establecido que el nivel para esa prueba es 0.067, 
que es menor que el especificado en la tabla J. La explicación de esta discrepancia reside en que en la tabla 
J los niveles declarados son mayores o iguales que los reales. Esto se hace con el propósito de presentar 
una tabla compacta para niveles de significancia aproximados 0.001, 0.005, 0.01, 0.025, 0.05 y 0.10, lo 
que no sería posible reportando los niveles exactos, ya que la distribución de T, (y de S4) es discreta, y 
es difícil que existan pruebas con niveles de significancia especificados de antemano. De cualquier modo 
los niveles declarados en la tabla J protegen al usuario por lo que toca al nivel de significancia, y para 
tamaños mayores de muestra son prácticamente exactos. 


Finalmente señalamos que la tabla J utiliza la simetría de la distribución de T}, proporcionando 
únicamente puntos críticos para pruebas de la cola derecha. Dado que T, toma valores de 0 a mn, 
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la tabla sólo da valores T ¿my para œ = 0.001, 0.005, 0.01, 0.025, 0.05 y 0.10. Los valores E (ma) 
para pruebas en la cola izquierda se obtienen, dada la simetría de la distribución de T}, mediante la 
expresión: 


T gaa =nm-T 


1 a 


(13.3) 


Una vez hechas estas observaciones describimos el procedimiento para una prueba de Mann y Whitney. 


Antes de presentar un ejemplo discutimos la asignación de rangos cuando dos o más observaciones tienen el 
mismo valor, es decir, cuando se tienen lo que llamamos empates. Supongamos que r (r > 2) observaciones 
tienen el mismo valor. Cuando se ordenan las n + m observaciones colocamos esas r observaciones en la 
secuencia en cualquier orden en seguida de la que tiene el valor inmediatamente menor que ellas. Sea / la 


posición de la observación que precede a las empatadas. El rango (igual) que se asigna a cada una de las 7 
observaciones con el mismo valor es: 
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((+D+(1+2)+-+(1+7) 


r 


o sea que el rango que se asigna a las r observaciones empatadas es el promedio de los rangos que les 
corresponderían si estuvieran en orden ascendente. Esta larga descripción será fácilmente entendible mediante 
un ejemplo. Supóngase que tenemos dos muestras, con sus observaciones ordenadas: 


pda ya 13% (n = 7) 
8, 10, 15, 17,19,23. (m= 9) 


Para las 3 observaciones con valor 5 obtuvimos el rango 6; esto es porque hay 4 observaciones (0, 1, 3 y 4) 
menores que ellas, o sea que sus posiciones son la quinta, sexta y séptima. El rango que les corresponde es 
entonces: 


(U +1)+(+2)+(1+3)_5+6+7 _ 
3 3 


6 


Igualmente, a las dos observaciones con valor 15 les corresponden los lugares 12 y 13 y, por tanto, se les asigna 
el rango 12.5. 


El lector debe notar que esta forma de asignar rangos preserva la magnitud de S, + S_. En efecto, si no hubiese 
empates tendríamos: 


em + +m+1 xI 
sts = Dis EOUM IT 36 


i=] 


que es el mismo valor de S, + S_ con el método propuesto. 
Enseguida se presenta un ejemplo de aplicación de la prueba de Mann y Whitney. 
Ejemplo 13.4. Para comparar dos métodos de alfabetización se toman muestras, de tamaños 12 y 11, de una 


población de analfabetos. A los integrantes de la primera muestra se les instruye con un método tradicional (7), 
y a los de la segunda con un método nuevo (N). Al final del curso se registra el número de palabras por minuto 


que cada individuo lee. Los resultados son: 
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Método 


> (X) Nuevo (Y) 


Número de palabras leídas 


TE PEER 


La tabla para asignación de rangos se presenta a continuación. 


S,=1140  S_= 162.0 


La hipótesis del experimentador es que el método nuevo es más eficiente que el tradicional. Puesto que el 
método nuevo se ha identificado con la variable aleatoria Y, el juego de hipótesis a probar es: 
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Ho: My 2 My en oposición a Ha: My < My 
La estadística para la prueba es T}, que con los datos del experimento toma el valor: 


n(n+1) _ 
E a 


4 00 
2 


T,= Y R(X)- 36 


i=l 


y la regla de decisión es rechazar Ho si T, < nm—T inm. Si tomamos æ = 0.05 leemos, en la tabla J, 


To.05(12,11)=93, por lo que la regla de decisión es rechazar Ho si T, <132—93 = 39. Puesto que 7, = 36, 
que es menor que 39, decidimos rechazar Ho con a = 0.05. 


El lector debe notar que si usamos la estadística: 


el área de rechazo estaría a la derecha. Con esta estadística requerimos 


Ty (m,n) = Ta o5(11,12) = Tg o5(12,11)=93 


Puesto que 7_ > 93, la conclusión es la misma que antes. Es decir, que con æ = 0.05 concluimos que el método 
nuevo aumenta la velocidad de lectura. Esto quiere decir que usando la estadística adecuada siempre pueden 
leerse los valores críticos directamente de la tabla J. 4 


La tabla J sólo nos sirve cuando los tamaños de muestra 7 y m son menores o iguales que 20. Para 2 o m mayores 
de 20 puede usarse la aproximación Normal, que se describe en seguida. 
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En caso de empates se modifica el valor de la varianza de T, usada en el denominador de Z}. La varianza de 
T, es entonces: 


` 2 
Da2 De (e -1) 
OT, =A i j=l 


(mL my 1] (13.6) 


donde r es el número de empates y e; el número de observaciones en el j-ésimo empate. 
Ejemplo 13.5. Para ilustrar la aproximación anterior usamos los mismos datos del ejemplo 13.4. Allí encontramos: 


T, =36, n=12, m=11 


Y, por tanto: 
ur, = E =66. 
A AA =264 
De donde: 
_ 36-66 _ 


Puesto que la prueba es de la cola izquierda, encontramos que el nivel observado de significancia es: 


a=P(Z, <-1.85)=0.0322 


Capítulo 13 
ALGUNAS TÉCNICAS NO PARAMÉTRICAS 


por lo que Ho: My > My se rechaza en favor de Ha: My < My con cualquier æ > 0.0322 (en particular 
con æ = 0.05). Además, el nivel observado de significancia es muy similar al que se obtiene con la prueba 
exacta, según puede verificarse por interpolación lineal en la tabla J. Es decir que, aun con tamaños de muestra 
pequeños, la aproximación es razonablemente buena. En este caso sólo hay dos empates (en 69 y 72), por lo que 
r = 2. Además, hay dos observaciones en cada empate, es decir, que e, = 2 y e, = 2. El factor de corrección 
para 07, es: 


Se, (e -1) 


E -1-204220 _ 


= 0.999 
23[(23* -1] (23)(528) 


Por tanto: 


07, =(264)(0.999) = 263.76 


El valor corregido de Z, es: 


_ 36—66 _ 


Z= =—1.85 
* 4263.76 


por lo que no se modifican los resultados. Cuando hay más empates debe usarse siempre oF. . + 


Finalizamos esta sección presentando un método para construir intervalos de confianza para My — My usando la 
prueba de Mann y Whitney. El procedimiento se basa en la idea, ya discutida ampliamente en el capítulo 10, de 
que un intervalo con nivel de confianza 1 — & para My — My puede obtenerse usando la región de aceptación 
para la hipótesis Ho: My = My en oposición a My — My . En seguida se describe brevemente la técnica. 
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Ejemplo 13.6. Suponga que se tienen dos muestras independientes de tamaños n = 5 y m = 8. De acuerdo con 


la descripción anterior, debemos calcular las 40 diferencias entre las observaciones y ordenarlas. Si queremos un 
intervalo de confianza al 95% requerimos 


To.975 (5-8) = 40 — To.025 (5-8) = 40-33 =7 


Así que, una vez ordenadas las 40 diferencias, contamos las 7 mayores para obtener el límite superior y las 7 
menores para obtener el límite inferior. 


Los datos que se presentan enseguida son los índices de agresividad asignados por un psicólogo a adolescentes a 
los que se ha aplicado pruebas de diagnóstico. Se tienen muestras de tamaños 5 y 8 de dos grupos sociales 


Grupo 1 (X) | 6.5, 8.0, 7.5, 10.0, 6.0 


Grupo 2 (Y) | 9.0, 7.0, 8.5, 6.0, 9.5, 


Enseguida se presentan las diferencias ordenadas. En realidad no es necesario calcular las nm diferencias; basta 


con las 7, _., yin.) mayores y las 7, , menores. 


-a/2!"” 
5.0, 4.5, 4.0, 3.0, 3.0, E; da 2.0, 
2.0, 1% LS, ER 1.3 1.0, 1.0; 1.0, 
1.0, 0.5, 03 0:5, 0:5; 0, 05. 05 

—-0:5, —1.0, —1.0, —10, —L0, =1.5, —1.5, —2.0, 

—20, 20 =23 232 25; -30 -—30, -35 


Contando 7 de mayor a menor encontramos el valor 2.5, y contándolas de menor a mayor obtenemos — 2.0, 
por lo que el intervalo de confianza al 95% para My — My es: 


(2.0, 25) 


El intervalo contiene el valor cero, por lo que en el juego de hipótesis Ho: My = My en oposición a 
Ha: My + My no se rechaza Ho con a = 0.05, según puede verificarse haciendo la prueba correspondiente. 
+ 


13.4. La prueba de Kruskal y Wallis 
para más de dos muestras independientes 


En seguida se describe e ilustra una prueba no paramétrica que puede usarse alternativamente al análisis 
estudiado en el capítulo 11 para datos obtenidos en un Diseño Completamente Aleatorizado, cuando la escala 
solamente es ordinal o se desconfía de la suposición de Normalidad. La estructura de los datos es la de un DCA 
y se reproduce en seguida para conveniencia del lector. 
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Tabla 13.2. Datos de un DCA 


Tratamiento 


1 2 -e t 
Yi Yı q Ya 
Js a å Ya 
Yn Ym U Ya 


Las suposiciones para la prueba son: 


a) Las ż muestras son muestras aleatorias de sus respectivas poblaciones, y además son independientes 
entre sí. 


b) La escala de medición es al menos ordinal. 


La hipótesis que se prueba es similar a la del A de V, y se normaliza en seguida. 


El procedimiento para la prueba es muy simple. De hecho, la técnica es una extensión de la de Mann y Whitney. 
El primer paso consiste en asignar rangos a las 2, +m, ++"+m, observaciones. Sea N =m +m +++n, el 
número total de respuestas, entonces a Y, (i = lr. tj= Laat) le corresponderá un rango entre 1 y N. 
Enseguida las observaciones de la Tabla 13.2 se sustituyen por los rangos que les corresponden, o sea por 


R(Y; ), según se muestra. 


Tabla 13. 3. Rangos y estadísticas en una prueba de Kruskal-Wallis. 


Tratamiento 
1 2 a 3 
R(%,1) R(Y,,) as R(Y,,) 
R(Yi2) R(Y,) z R(Y,,) 
A Rm) + Ra) 
E XA AM 


En la Tabla 13.3, R,,R,,..., R, son las sumas de los rangos en los tratamientos 1, 2,..., t£. Es decir, que: 


an 
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j=l (13.7) 
La estadística para la prueba es: 


a AK 
Tala NI 
NNDS n ( ) 


i=l 


(13.8) 


La distribución de T bajo Ho no es difícil de calcular, pero su presentación en una tabla requeriría mucho 
espacio, ya que para cada valor de ż (el número de tratamientos) habría que considerar los diferentes valores de 
MM,- 7, por lo que es usual aproximar la distribución de T bajo Ho por la distribución Ji-cuadrada con ż—1 
grados de libertad. La regla de decisión es entonces: 


Rechazar Ho si T > Mimo 


Además, en la Tabla K se presenta la distribución de T bajo Ho para 1=3 y n; <5(¡=1,2,3). Para 1>4,0 
t = 3 con tamaños de muestra mayores de 5, debe usarse la aproximación de Ji-cuadrada. La tabla proporciona 
niveles observados de significancia para algunos valores posibles de T. 


Ejemplo 13.7. En un campo experimental se comparan tres variedades de trigo en cuanto a los días transcurridos 
de la siembra a la madurez. Se plantan cinco unidades experimentales con la variedad A, cuatro con la B y cuatro 
con la C. 


Los datos del experimento se presentan enseguida. Aunque la escala es razonablemente fuerte, tanto la suposición 
de normalidad como la de homogeneidad de varianzas podrían no cumplirse, por lo que se ha decidido emplear 
una técnica no paramétrica. Por supuesto, en la práctica está a juicio del investigador decidir la técnica apropiada, 
de ser posible verificando la adecuación de sus datos a las suposiciones necesarias para aplicar correctamente 
una técnica. 
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Variedad 
A B G 
172 175 160 
169 164 160 
180 150 150 
172 161 148 


R; 52.0 26.5 12.5 911304) 


f 12 


; R? 
R In 540.80 175.56 39.06 | »)==755.42 
n 


En este ejemplo M =5+4+4=13, por lo que T toma el valor: 


ra E 
(13)014) 


(755.42)— 3(14) = 7.808 


De la Tabla K leemos, para m =5, m =4 y m =4, P(T > 7.7604) = 0.009 , por lo que, dado que 7.808 es 


un valor más extremo: 


&= P(T 27.808) < 0.009 


Además de que la Tabla K es incompleta, los valores de la estadística T que allí aparecen están calculados bajo 
la suposición de que no hay empates entre las observaciones. De allí las discrepancias que se observan cuando 
hay empates. 


En caso de no disponer de la Tabla K usamos la tabla de Ji-cuadrada con dos grados de libertad. Con la 
aproximación se rechaza Ho con cualquier A > 0.025, lo que indica que para estos tamaños de muestra la 
aproximación todavía no es muy buena. La conclusión sería, usando la Tabla K, que los tratamientos son 
diferentes con un nivel de significancia Y = 0.01. 


Enseguida ejemplificaremos el cálculo de la estadística T`. En este caso hay tres empates (en 150, 160 y 172), 
por lo que r = 3. En los tres empates hay dos observaciones con el mismo valor, por lo que e, =e, =e; =2. 


T` es, entonces, de acuerdo con (13.9): 
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5 7.808 
"AA A A 
(13) 68) 


En este ejemplo usar To T no modifica el nivel observado de significancia. En caso de más empates el uso 
de T es imprescindible, y por tanto debe calcularse siempre, ya que mejora la aproximación a la distribución 
Ji-cuadrada. 6 


13.5. Pruebas de hipótesis e intervalos de confianza para dos muestras 
apareadas y para una muestra 


En esta sección introduciremos métodos no paramétricos para dos muestras apareadas y, por un proceso 
inverso (pero igualmente lógico) al seguido en los capítulos 8 a 10, para una muestra de una población. 
En un diseño en bloques con dos tratamientos se tienen los » pares de observaciones (X,,Y ), (X,,Y,),..., 
(X,, Y, ). La idea de aparear las observaciones para reducir el error experimental se traduce en el análisis de 
las diferencias dentro de los pares, o sea las variables aleatorias D; =Y, — X, (í=1,...,m). En los métodos 
paramétricos supusimos que D; ~ N(u,,0%, ), para ¿=1,2,..., 1, y usamos las técnicas de inferencia basadas 
en el modelo Normal. Además de la suposición de normalidad, aceptamos implícitamente que la escala de 
medición era al menos de intervalo. Enseguida presentamos técnicas cuyos resultados son confiables cuando 
una (o ambas) de las suposiciones anteriores no se cumplen. En primer lugar estudiamos la llamada Prueba del 
Signo, y en seguida la Prueba de Rangos con Signo de Wilcoxon. Como todas las pruebas (paramétricas o no), 
las de esta sección son óptimas cuando se cumplen las suposiciones en que se basan. Si aplicamos una prueba 
de Wilcoxon y las variables aleatorias D; tienen una distribución Normal, estamos usando ineficientemente 
la información. Si usamos una prueba de ż y las D; se apartan mucho de una distribución Normal, también 
estamos usando mal los datos. 


La Prueba del Signo 


Esta es posiblemente la más antigua de las pruebas estadísticas, y es muy sencilla de 
entender y de llevar a cabo, ya que se reduce a una prueba binomial con pọ =1/2. 


An argument for divine providence, taken from the constant regularity 
observd in the birth of both sexes (Philosophical Transactions of the 
Royal Society, 1710). 


Prevé una hipótesis Fisheriana Diseño vs. Azar. John Arbuthnot 
1667-1735 
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La lógica de la prueba y de la hipótesis pertinente será clara si describimos el cálculo de la estadística. Cada 
par se clasifica como “+” si Y, > X;, como “—” si Y, > X; y como “cero” si Y, = X;, y no se toma en 
cuenta a los pares donde Y, = X,. Es decir, que en esta prueba las observaciones empatadas se descartan. 
Con esta información es claro que la hipótesis nula de igualdad de tratamientos puede expresarse como 
Ho: P(+)=P(=)=1/2, donde P(+)= P(Y, > X;) y PO) = P(Y; < X;). Los tres juegos de hipótesis 


tradicionales son, en este caso: 


a) Ho: P(+)=P(-) en oposición a Ha : P(+) 4 P(-) 
b) Ho: P(+)< P(-) en oposición a Ha: P(+) > P(=) 
c) Ho: P(+)> P(-) en oposición a Ha : P(+) < P(=) 


donde las implicaciones de rechazar Ho en cada juego son evidentes. Así, en b), rechazar Ho equivale a concluir, 
al nivel de significancia establecido, que el tratamiento asociado con la letra Y tiene valores mayores que el otro. 


Sea n' el número de pares donde no hay empates. La estadística para la prueba es: 
T, = número de pares donde Y, > X; 


Alternativamente puede usarse 7_ = número de pares donde Y, < X,, dado que T, +7_ = n'. Aquí, daremos 
las reglas de decisión con base en T}. 


Puesto que bajo Ho, T, ~ Bin(n', 1/2), las reglas de decisión son las ya conocidas para una prueba Binomial 
con p) =1/2, por lo que en vez de repetirlas, presentamos un ejemplo. También puede usarse la aproximación 
Normal para muestras grandes usando la estadística: 


Tumpa 


Es 
j vVn'lá 


Ejemplo 13.8. En un experimento para comparar la aceptación por parte de los consumidores de dos 
formulaciones del mismo alimento, una de las cuales contiene un aditivo y la otra no, se les da a probar las dos 
formulaciones a cada una de quince personas, sin decirles cuál es el orden en que se les ofrecen. Dicho orden se 
aleatoriza además para cada individuo (bloque). Puesto que es difícil asignar un número al gusto por un sabor, 
se pide a cada participante que asigne la letra A al sabor que le guste más, y la letra B al otro, o sea que A > B. 
Los datos del experimento son: 


1 
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s Individuo 
Tratamiento 


Con aditivo (Y) 
Sin aditivo (X) 
Signo de Y,— X; = 


ojo wjn 
+| >|u 
ol» >jv 


En los individuos 2 y 9 hubo empates, por lo que »'=13, y el valor de T, es 3. La hipótesis es que el aditivo 
estropea el sabor, es decir, que 


P(Y,- X; >0)= PŒ) < P= P(Y,- X; <0) 
Formalmente: 
Ho: P(+)> P(—) en oposición a Ha : P(+) < P(-) 
De la Tabla A obtenemos el valor observado de significancia de T, que es, usando »’' =13 y P =1/2: 


& = Ps, (T, £ 3)= 0.0461 


por lo que se rechaza Ho con cualquier æ mayor de 0.0461, y se concluye que hay preferencia por el alimento 
sin aditivo. 4 


La Prueba de Rangos con Signo de Wilcoxon 


Para una prueba de Wilcoxon requerimos la misma estructura de datos que en una prueba del signo, es decir, 
que se tienen dos muestras apareadas. 


Además de las suposiciones para la prueba del signo es necesario suponer que: 
a) Las D; son variables aleatorias con distribución simétrica. 
b) Las D; pueden ordenarse. 
Como puede verse, está implícito que los datos tienen más información que en la prueba del signo. 


Sea Mp la mediana de la distribución teórica de D,. Los tres juegos de hipótesis de interés son: 
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a) Ho:M,=0 en oposición a Ha: Mp #0 
b) Ho:Mp <0 en oposición a Ha: My >0 
c) Ho:Mp 20 en oposición a Ha: My, <0 


Puesto que D; =Y; —X;, es clara la interpretación de estas hipótesis. Así, por ejemplo, en &) la hipótesis 
alternativa implica que el tratamiento asociado con la letra Y tiene valores mayores que el otro. 


El procedimiento para la prueba consiste en calcular las n diferencias D; = Y, — X;. En caso de empate en un 
par, éste se desecha. Sea 2' el número de pares en los que no hay empates. Luego se asignan rangos 1 a n’ a los 
valores absolutos | D, |,| D» |,...,] D; | de las D; diferentes de cero. Si hubiése empates entre los valores | D; | se 
les asigna el rango promedio según se ilustró al describir la prueba de Mann y Whitney. Sean R, R,,..., R, los 
rangos asignados a | D, |,| D, |,...,] D} |, entonces definimos: 


. [Osi Y, <X;(D, <0) 
"IR si Y, > X, (D; >0) 


La estadística para la prueba es: 


Como es fácil visualizar, valores grandes de T favorecen a la hipótesis alternativa en b), y valores pequeños a Ha 
en £). La distribución de T bajo Ho no es difícil de calcular y toda la lógica se basa en que si Mp = 0, entonces 
P(R = 0) = P(R = R). En la Tabla L se presentan valores críticos 7”, para 4 = 0.005, 0.01, 0.025, 0.05, 
0.10, 0.20, 0.30, 0.40 y 0.50, y n = 3, 4,5,...,20. Valores T gw se obtienen, dado que la distribución de T es 
simétrica, mediante la ecuación: 


(13.10) 
Las reglas de decisión para los tres juegos de hipótesis propuestos son: 


a) Rechazar Ho si T > Iza oT< si 


-a/21" 


b) Rechazar Ho si T >T.,., 


c) Rechazar Ho si T <T_¿n) 


Ejemplo 13.9. Para comparar el efecto preventivo de dos fungicidas en plantas de algodonero se eligen 20 
plantas, cada una de las cuales se divide en dos partes iguales, y a cada mitad se le aplica uno u otro fungicida 
(al azar). Se expone cada planta a la acción de las esporas de un hongo y, al cabo de cierto tiempo, se cuenta 
el número de pústulas en cada una de las partes de cada planta. Los datos obtenidos son: 
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Número de pústulas causadas por el hongo 


Planta Fungicida A Fungicida B 


1 8 16 
2 12 13 
3 14 7 
á 16 16 
5 9 4 
6 5 8 
7 2 12 
8 7 3 
9 6 9 
10 6 12 
11 2 3 
12 á 1 
13 5 15 
14 0 2 
15 2 13 
16 18 10 
17 Í Z 
18 2 19 
19 4 20 
20 1 15 


Si identificamos al fungicida A con la letra Y y al B con la letra X, obtenemos las siguientes estadísticas. 


Planta "aa Ph |D;| R; R; 
1 -8 8 12.5 0 
2 -1 1 1.0 0 
3 7 7 10.5 10.5 
4 0 0 - - 
5 5 5 7.0 7.0 
6 -3 3 4.0 0 
7 —10 10 14.5 0 
8 4 4 6.0 6.0 
9 <3 3 4.0 0 
10 —6 6 8.5 0 
11 = 7 10.5 0 
12 3 3 4.0 4.0 
13 10 10 14.5 0 
14 -2 2 2.0 0 
15 —11 11 16.0 0 
16 8 8 125 125 
17 =6 6 8.5 0 
18 17 17 19.0 > Y 
19 16 16 18.0 0 

20 -14 14 17 0 


19 19 
YR=190 NR =40 
i=l 


i=] 
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En este ejemplo hay una D; =0, por lo que sólo se opera con 2'=19 observaciones. De aquí que la suma de 
los rangos asignados sea: 


19 
NR = mz =190 


i=l 


La estadística T toma el valor 40. Éste es un valor pequeño comparado con el máximo posible, que es 190. Esto 
se debe a que los valores Y, — X, son mayoritariamente negativos, sobre todo para las D; más grandes. Es decir, 
que el valor de T refleja que hay más pústulas en el fungicida B, por lo que el efecto preventivo de A parece ser 
mejor. En seguida probamos: 


Ho: M,, =0 en oposición a Ha: Mp #0, 


con æ@=0.05. Consultando la Tabla L obtenemos 7;.p,5(19)=143, por lo que 7;y75(19)= 47, y debe 
rechazarse Ho si T >143 o T < 47. Puesto que T = 40, se rechaza Ho con A = 0.05. El nivel observado de 
significancia aproximado es de 0.02. Si hubiéramos usado una prueba del signo la estadística de prueba sería 
T, =5, y el nivel observado de significancia: 


& =2Ps;, (T, <5) = 2(0.03118) = 0.0636. 


Esta diferencia en los niveles de significancia se debe a que la prueba del signo no utiliza toda la información en 
los datos, concretamente no utiliza el hecho de que las diferencias con signos positivos tienen rangos pequeños 
y, por tanto, no da valores tan extremos como la prueba de Wilcoxon para la estadística de prueba. 4 


Para muestras grandes puede usarse aproximación Normal, según se describe enseguida. 


Meropos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Ejemplo 13.10. Con los datos del ejemplo 13.9 usamos la aproximación Normal. Se tiene T =40, n'=19, por 


lo que: 
_ UDO ae 2 _ (9(20)139 _ 
My = ME E 95; 07 = —a a 617.5 
de donde: 
Z= -im ETT 


y el nivel observado de significancia es: 


a=2P(Z <-2.21)= 2(0.0136) = 0.0272, 


valor muy similar al obtenido usando la Tabla L. 


Para ejemplificar el uso de la corrección en 13.13 observamos que hay cinco empates entre las |D;| en los valores 
3, 6, 7, 8 y 10, es decir que r=5. Además, e, =3, e, =2, e, =2, e4 =2 y e; =2, por lo que: 


r 


1 
A 2100+008] 


y, en consecuencia: 


07 =617.5-1.0=616,5 


El valor de Z, con la corrección es: 
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por lo que la corrección no modifica los resultados trabajando con dos decimales. En caso de más empates debe 
a , 
usarse 97 en el cálculo de Z}. 6 


Uso de la Prueba de Wilcoxon con una sola muestra 


En seguida describimos una modificación muy sencilla de la prueba de Wilcoxon, con objeto de usarla para 
probar hipótesis sobre el parámetro de localización de una distribución probabilística. 


Se tiene una muestra aleatoria Y,, Y,,..., Y, de una población cuya mediana es My. Queremos probar uno de 
tres juegos de hipótesis: 


a) Ho: My =m en oposición a Ha: My 4 my 

b) Ho: My Sm en oposición a Ha: My > my 

c) Ho: My Zm en oposición a Ha: My < m 
donde 7g es un valor arbitrario fijado por el investigador. El procedimiento de prueba consiste en calcular las 
n diferencias D; = Y, — m, y de allí en adelante proceder como en la prueba de Wilcoxon para dos muestras 


apareadas. Es decir, que formamos los » pares (Y, ,» ), (Y, mp ),..., (Y, , mp ). La lógica de la prueba es clara si 
consideramos que la estadística es: 


donde, en este caso: 


r 0 si Y, < m. (D; <0) 
i |R, si Y, >m .(D; >0) 


y n' es el número de observaciones en que Y, # m. 
Las reglas de decisión para a), b) y c) corresponden a las ya descritas en el caso de dos muestras. 


Ejemplo 13.11. Una agencia de protección al consumidor registra el número de quejas que recibe diariamente. 
De sus registros se obtiene el número de quejas en 15 días distintos, y se quiere probar la hipótesis de que la 
mediana del número de quejas es mayor de 80. Los datos para los 15 días examinados son: 


Y: 62, 89, 82, 75,76, 81, 83, 87, 100, 54, 88, 102, 75, 79, 64. 


La hipótesis por probar es: 


nl 
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Ho: My, <80 en oposición a Ha: My >80 


Las 15 diferencias D; = Y, —my, los rangos de |D,| , los valores de R; y el valor de T se muestran en la siguiente 
tabla. 


El valor de la estadística de prueba es: 


T =62.5 


El lector debe notar que 62.5 no es un valor extremo (el máximo posible de T es 120), por lo que no 
parece razonable rechazar Ho. De la Tabla L obtenemos żo5(15)= 89, to10(15)=83, tp,9(15)=75, 
to.30(15)=69, to 40 (15) =65, £050(15) = 60, por lo que deducimos que & = 0.45, es decir, que para rechazar 
necesitamos tolerar un Error Tipo I de 45 %, y por lo tanto no rechazamos Ho. 4 


Intervalos de confianza para dos muestras apareadas y una muestra, 
usando la prueba de Wilcoxon 


De acuerdo con la correspondencia que hemos establecido desde el capítulo 9 entre pruebas de hipótesis e 
intervalos de confianza, aquí usamos la región de aceptación de una prueba de dos colas para obtener un 
intervalo de confianza usando la técnica de Wilcoxon. Aprovechamos la oportunidad para insistir en que el 
intervalo de confianza es mucho más informativo que la prueba de hipótesis, y que el orden que se ha seguido 
en este texto obedece únicamente a que es ventajoso desde el punto de vista de la exposición. 


La técnica se describe en seguida para dos muestras apareadas. En el caso de una sola muestra (Y, ,..., Y, ) basta 
tomar D; =Y; (¿=1,...,n) y usar el mismo procedimiento para obtener un intervalo de confianza para My. 
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En seguida ilustramos la técnica usando los datos del ejemplo 13.9, donde se comparó la acción preventiva de 


dos fungicidas. 


Ejemplo 13.12. En el ejemplo 13.9 obtuvimos las diferencias D; = Núm. de pústulas con fungicida A - Núm. 
de pústulas con fungicida B. Los valores D, obtenidos son: 


—8, ls Fs 0, S =3, —10, 4, —3, —6, 
== 3 =] =2 -1l, 8 —6, -17, —16, —14. 


Aunque hay 210 promedios posibles no es necesario calcularlos todos. Si se quiere un nivel de confianza de 
0.01, basta calcular los 7; 995(20) mayores y menores. En este caso Th 995(20) = 38. Para hacerlo es conveniente 
ordenar las D; como sigue: 


8, Ys J 4, de 0, a =g, Y, 3, 
=6, -—6 -—7, -—8, —10, —10, —1l, —14, —16, -—17. 


Los promedios mayores son: 


8.0, FO 7.0, 6.5, 6.0, 6.0, $, 5D 5.0, 
5.0, 4.5, 4.0, 4.0, 4.0, 3% 3.5, 3:35 3.0, 
3.0, 3.0, Ay 2d 2:9; LD 2; 2.0, 2.0, 
2.0, 13, 13, 1.3, 1.0, 1.0, 1.0, 1.0, 1.0, 


1.0, 0.5, 0.5, 0.5, 0.5, 0.3, 0.5, 0, 0, 
0, 0, 0, —0.5, —0.5, —0.5, —0.5, —1.0, —1.0, 
10 s 


y los menores: 


“o —=80, —8.0, —8.0, —8.0, -8.5, —8.5, —8.5, 
=8.5; —8.5, =8.5, -8.5, -—8.5, —9.0, —90,  —9.0, 
=9.0, —9.0, —9.5, =9.5, -—9.5, —9.5, —10.0, —10.0, 

—10.0, —10.0, —10.0, —10.0, —10.0, —10.5, —10.5, —10.5, 

=110, —11.0, —1L0, —11.0, —115, —11.5, —115, —120, 

=120, —120, —120, -125, —125, -130, -130, =133, 

13.5, —13.5, —140, —14.0, —15.0, —15.5, —16.0, —16.5, 


Contando 38 de mayor a menor obtenemos el promedio 0.5, y contando 38 de menor a mayor encontramos 
el valor —9.5. Por tanto, el intervalo de confianza para la mediana del tratamiento A menos el B es (—9.5, 
0.5), con un nivel de confianza 1— & = 0.99. El intervalo contiene el valor cero, por lo que Ao: My =0 
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en oposición a Ha: Mp #0 no se rechaza con AG = 0.01. En cambio, si se toma & = 0.05, el intervalo de 
confianza que se obtiene es (—8.0, — 1.0), por lo que sí se rechaza Ho con æ = 0.05. Estos resultados son (como 
deben ser) consecuentes con los obtenidos en el ejemplo 13.9, donde se determinó que el nivel observado de 
significancia para la prueba de dos colas es aproximadamente 0.02. 6 


13.6. La prueba de Friedman para diseños en bloques aleatorizados completos 


La prueba no paramétrica más usada para un diseño en bloques aleatorizados completos recibe el nombre de 
Prueba de Friedman, y se describe muy brevemente a continuación. 


La estructura de los datos para la prueba fue descrita en el capítulo 11, y se repite aquí para facilitar la 
exposición. 


Tabla 13.4. Datos en un DBAC 


Tratamientos 


Bloques 


1 2 t 
1 Yi XL Yı 
2 Yz Yz Ya 
6 E E Y, 


Al igual que en la prueba de Kruskal y Wallis, se cambian las observaciones originales por rangos. La diferencia 
es que aquí se asignan rangos a los tratamientos por separado dentro de cada bloque. Es decir, que R(Y; ) 
sólo toma valores en los enteros 1, 2,..., t. Esto es congruente con la aleatorización restringida que se tiene en 
el diseño, la que nos lleva a comparar Ts tratamientos dentro de los bloques, o sea que se determina cuál es 
la observación menor, cuál la segunda menor, etc., en cada uno de los b bloques, obteniéndose las variables 
aleatorias: 


con valores posibles 1, 2,..., £. 


Ahora obtenemos la suma de los rangos de cada tratamiento: R, R,, Ry,..., R,: 


Jm (13.14) 


a 
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La estadística para probar Ho : los efectos de los ¢ tratamientos son iguales en oposición a Ha : Al menos un 
tratamiento tiene efecto distinto es: 


t 2 
12 E -AEN 


ADE 2 (13.15) 
Una forma más conveniente para el cálculo es: 
Ri |-3b(++1) 
le | (13.16) 


En la Tabla M se presentan valores observados de significancia de la estadística T para 1=3 y b<9, y para 
t=4yb< A En otros casos puede usarse una aproximación a la distribución Ji-cuadrada. Entonces se rechaza 
Hosi T > Xa- 


Ejemplo 13.13. En un experimento para comparar la duración del dibujo de cuatro tipos de llantas se toman 
cuatro automóviles, y en cada uno se asigna aleatoriamente un tipo a cada una de las cuatro posiciones. Los 
resultados (en kilómetros recorridos) son: 


Bloque Tratamiento (tipo de llanta) 
(vehículo) A B C D 
1 42000 40800 49000 38000 
2 43612 44000 51000 36000 
3 42830 51600 50700 39318 
4 49800 39720 49900 40642 


Asignando rangos a los tratamientos dentro de cada bloque se obtiene: 


Tratamiento 


Bloque y B T D 
1 s) 2 4 1 
2 2 3 4 1 
3 2 4 3 1 
4 3 1 4 2 > 
R; 10 10 15 5 40 
R 100 100 225 25 450 


Se tiene entonces; 


YR = 450, 1=4, b = 4, por lo que: 
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12 
ggg L0- 006) =7.5 


De la Tabla M obtenemos: 


&= P(T >7.5)=0.052 


por lo que con cualquier æ = 0.052 concluimos que los tratamientos son distintos. El lector debe verificar que 
este es (muy aproximadamente) el nivel observado de significancia obtenido usando la distribución Ji-cuadrada 


con 3 grados de libertad. 


13.7. Técnicas basadas en la distribución Ji-cuadrada. 
(Análisis de datos categorizados) 


En esta sección presentamos métodos cuyo común denominador es que son aplicables a datos medidos 
al menos en escala Nominal, y cuyas reglas de decisión se toman usando la distribución de Ji cuadrada. 
Puesto que los datos en escala Nominal se separan en categorías (clases), es frecuente que las técnicas que 
siguen se presenten bajo el rubro de Análisis de Datos Categorizados y que se les aísle de las técnicas no 
paramétricas, de la misma manera que algunos métodos para la Binomial se estudiaron separadamente. 
Como veremos enseguida, es igualmente razonable discutirlos en este capítulo. Cuando se tienen repeticiones 
independientes de un experimento cuyos resultados sólo pueden clasificarse en una de $ clases mutuamente 
excluyentes, toda la información del experimento puede concentrarse en una tabla de frecuencias: como la 
que se muestra en seguida. 


Tabla 13.5. Estructura de los datos en un modelo Multinomial 


Clase 1 2 ez k $ 


Frecuencia Ay na ze ny n 


k 
En la tabla, 7; es el número de observaciones en la clase ¡-ésima, k es el número de clases posibles y 7 = > n; 
i=l 
el número de repeticiones del experimento o el tamaño de muestra, según el caso. Esta situación ya ha 
sido estudiada cuando > 2, y el modelo probabilístico derivado fue el Binomial. Para k> 2 se tiene una 
extensión del modelo Binomial que recibe el nombre de Modelo Multinomial. A continuación establecemos 
los postulados del modelo y la función de probabilidades de la llamada Distribución Multinomial. 


m 
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En la Tabla 13.5, 7} ^»... n, son variables aleatorias, antes de realizar el experimento. La función de 
probabilidades conjunta de 7), 2),..., 2, Se llama Multinomial y su expresión es: 


n! > 
Plan) Im! Je Pr Pk» 
n: 


(13.17) 
donde: 


k k 
Xn; =n} P; =] 


i=l i=l 


Nótese que cada una de las variables 2, puede tomar los valores enteros positivos 0, 1,...,7, pero que la suma de 
ellas tiene que ser n. En realidad la especificación en (13.17) es redundante, ya que la función podría escribirse 
con sólo $—1 variables, del mismo modo que el caso particular += 2 (la Binomial) se escribe como función 
de una sola variable. En este caso eso no tiene mucha importancia, ya que no trabajaremos directamente con 
(13.17), pero conviene recordar que existe esa dependencia entre las variables. 


Apoyándonos en resultados conocidos de la distribución Binomial, es fácil derivar la media y la varianza de cada una 
de las variables 7; En efecto, si tomamos la celda ¿-ésima, con probabilidad de éxito p, y consideramos la ocurrencia 
de otra celda como fracaso, podemos identificar a », con una variable aleatoria Binomial (7, p; ). De donde: 


E(n;)= np; 
Var (n; )=np;(1- p;) 
O > (13.18) 


Además, puede probarse que las variables 74, 2,,..., 2, no son independientes, como lo sugiere el hecho de que 
p p q ER) k P 
m +m ++ +n, =n. La covarianza entre dos cualesquiera de ellas es: 


Cov(n;, n; )= -n ¡A 
(m0) =p 5%] (13.19) 
Estos resultados son importantes porque en datos con estructura multinomial no se utiliza directamente la 


función (), sino una aproximación a Ji-cuadrada que es consecuencia de una versión del Teorema Central del 
Límite. En efecto, la variable aleatoria: 
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E (7; — np; ? 
pas ) 


i=] np; 


tiene, bajo ciertas condiciones, una distribución que es aproximadamente Ji-cuadrada. 
Este hecho, descubierto por Karl Pearson (1857-1936), se explota en las pruebas que 
se discutirán en esta sección. 


La primera prueba que presentamos es la llamada Prueba de Bondad de Ajuste, que es 
muy útil para determinar si los datos de una muestra pueden modelarse mediante una 
función probabilísticaespecífica. Supongamosquebajoesafunciónlaprobabilidad 
de que un elemento pertenezca a la clase ¡-ésima es Di (¿=1,2,..., k). Se trata 


entonces de probar Ho: p, = pi, Pa = Pz». Pp = Ph» en oposición a Ha : al 
menos una p; % p; . Es claro que p; »..., p, deben ser tales que e p= 


Enseguida presentamos ejemplos que aclaran lo que acaba de discutirse. OS 
1857-1936 


Ejemplo 13.14. Un psicólogo sostiene que el número de suicidios durante la primavera es el doble que en 
cualquiera de las otras tres estaciones. Para verificar su hipótesis toma una muestra de tamaño 500 usando los 
registros policiacos de las principales ciudades del país, y clasifica a cada suicidio en una de cuatro clases de 
acuerdo con la estación en que haya ocurrido. Los resultados que obtiene son: 


Estación P V O T A 
Número de suicidios 182 96 120 102 500 


Si identificamos a la primavera con la clase 1, al verano con la clase 2, etc., la hipótesis nula que quiere probarse 


es: Ho: p =215, p =1/5, p =1/5, p =1/5, es decir, que p =2/5, p, =p, =p¿4=1/5. e 


Ejemplo 13.15. Un editor revisa un texto contando el número de errores de imprenta por página. Al final de la 
revisión de 100 páginas obtiene los siguientes resultados. 


Clases 
(Errores por página) 0 1 2 3 4 5 6 Fi D 
Número de páginas 15 27 25 20 7 3 1 2 100 


El editor supone que estos datos pueden ser representados por el modelo Poisson. Sin embargo, su hipótesis no 
determina automáticamente los valores p; ; para ello sería necesario que especificara a qué miembro de la familia 
P(A) se refiere. Así, si él supone que los datos pueden representarse por una Poisson con 4=1, las p; quedan 
especificadas. En ese caso tendríamos: 
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ex” 21 
A E = 0.367879 


a (y 4 
=P(X=1|2=1)= a = 0.367879 


—] 2 —] 
EUL-E 0183980 
2! 2 


=P(X=2|4=1)= 


etcétera. 


Sin embargo, suponer que puede especificarse de antemano el valor de 4 es poco realista; sería más razonable 
estimar el valor de 4 usando los datos. Volveremos posteriormente sobre este ejemplo. 6 


Ejemplo 13.16. En el ejemplo 2.3 se presentaron las edades de 83 investigadores en instituciones de investigación 
agropecuaria en México (ver Tabla 2.10). Con ellas se elaboró la tabla de frecuencias 2.11, la cual se reproduce 
en seguida, con frecuencias absolutas en vez de frecuencias relativas. 


Tabla 13.6. Tabla de frecuencias de las edades de 83 investigadores 


Clase (20.5, 25.5] (25.5, 30.5] (30.5, 35.5] 


Frecuencia g 42 21 
Clase (35.5, 40.5] (40.5, 45.5] (45.5, 50.5] 

Frecuencia fi 3 2 
Clase (50.5, 55.5] (55.5, 60.5] (60.5, 65.5] 

Frecuencia 2 2 1 


En cualquier análisis de los datos que originaron la Tabla 13.6, es probable que se suponga que es aplicable 
el modelo Normal. Si se quiere poner a prueba esta suposición puede usarse, como en el ejemplo anterior, 
la prueba de Ji-cuadrada para bondad de ajuste, a condición de que se especifique a qué miembro de la 
familia Normal nos referimos, es decir, que se den valores para 4 y O”. Una vez que se tienen valores de 
u y 07, los valores p; son fácilmente obtenibles. Por ejemplo, la probabilidad hipotética de la clase (20.5, 
25.5] es: 


Payo (20.5 < X 25.5) = poa eze == 
o o 


valor que puede obtenerse de la tabla de N (0,1), si u y O son conocidos. Al igual que en el ejemplo 13.5, la 
única estrategia razonable es estimar 4 y o” usando los datos que se tienen. 6 


Los ejemplos 13.14, 13.15 y 13.16 son típicos de dos situaciones en las que se quiere hacer una prueba de 
bondad de ajuste. En el ejemplo 13.14, la hipótesis nula especifica unívocamente los valores p; , es decir, las 
probabilidades de las celdas bajo la hipótesis nula, mientras que en los ejemplos 13.15 y 13.16 los valores 
de p;, dependen de parámetros desconocidos. En cualquier caso, una vez especificadas las p; la estadística 
usada es: 
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a SA (13.20) 
La forma más usual en que se escribe la estadística (13.20) es: 


t (0-5) 
2 i i 
kT 2 
Ho £ (13.21) 


donde O; es el valor observado de 7; en la celda ¡¿-ésima y E, = np, es el valor esperado de esa celda bajo Ho. Es 
decir, que (13.21) sólo es otra forma de escribir (13.20), pero tiene la ventaja de que subraya que el valor de la 
estadística depende de las discrepancias entre las frecuencias observadas y las que se esperarían si Ho fuese cierta. 
Es claro entonces que valores grandes de xô nos llevarían al rechazo de Ho. La distribución de %3 bajo Ho es 
aproximadamente Ji-cuadrada y los grados de libertad son: 


l=k-=1- (número de parámetros estimados para especificar las p; ). 


(13.22) 


La regla de decisión es rechazar Ho si y% > %4 (1). El procedimiento de prueba se resume en seguida: 


Antes de efectuar la prueba con los datos del ejemplo 13.4 es necesario hacer dos comentarios sobre la distribución 
de xå. 


nn 
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1. La distribución de z¿ bajo la hipótesis mula es aproximada y requiere tamaños grandes en las 
muestras. Además, si alguno (o varios) de los valores E, = np; es muy pequeño (digamos menor de 
5), la aproximación no es buena. En ese caso, y siempre que sea razonable, se recomienda unir celdas 
adyacentes para tener valores mayores de E,. En caso de muestras pequeñas se recomienda el uso de la 
llamada Prueba de Kolmogorov (ver referencia 13.4). 


, . 2 . . , 
2. El número de grados de libertad de x;, cuando no es necesario estimar parámetros es k—1, donde k es 
el numero de clases. El lector recordará que entre las $ celdas existe una relación, la que ahora se refleja 


disminuyendo en uno los grados de libertad. En caso de que se estimen parámetros, se disminuye un 
q p y 
grado de libertad más por cada parámetro estimado. 


Ejemplo 13.17. En seguida aplicamos la prueba a los datos del ejemplo 13.14. Los datos son: 


Estación Número de suicidios 


P 182 
V 96 
O 120 
I 102 
y 500 


Si identificamos a la primavera con la clase 1, quiere probarse: 
1 1 


a 


diferente de las especificadas. 


2 
ads dr ¡aer E o 


Ha : Al menos una 


1 
5 
Pi 


Los cálculos necesarios para la prueba se resumen en seguida. 


En este caso k=4, y no ha sido necesario estimar parámetros para especificar las p,, por lo que se tienen 3 
grados de libertad. De la tabla de Ji-cuadrada obtenemos: 
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Xaos (3) =7.8147 


por lo que no se rechaza Ho con 4 = 0.05, y concluimos que los datos son compatibles con la hipótesis del 
psicólogo. ® 


Ejemplo 13.18. Ahora hacemos una prueba de bondad de ajuste a la distribución de Poisson usando los datos 
del ejemplo 13.15. Los datos que se tienen son: 


Errores por página (x) 0 1 2 3 4 5 6 7 
Número de páginas (f) 15 27 25 20 7 3 1 2 


Como se recordará, la función de probabilidades Poisson tiene la siguiente expresión: 


4 3x 
g: 


A 


fx(x)= e N oS 


donde À es la media y es el único parámetro de la distribución. El primer paso es estimar 4, lo cual hacemos a 
través de X, calculada con la ecuación para datos agrupados: 


y 2% _ USO ARMA HD y 
AA 100 


La prueba de bondad de ajuste se hará entonces con respecto a una distribución de Poisson con 4=2. Las p; 
son, en consecuencia: 


[a ay y 


A =P (A =0)=— e? =0.135935 
P = P(X =1)= B = 2e? = 0.270671 
B =Py (X =2)= a =2e ? = 0.270671 
pa = Pm (X =3)= ea = ce = 0.180447 
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ps = Py (X =4)= Ai = L = 0.090224 
N S ce = 2 = 0.036089 
p; = Pa (X =6)= B = An = 0.012030 
N a e ES Ar = 0.003437 


Aunque en las observaciones sólo se tienen 8 clases, debe recordarse que la variable aleatoria Poisson puede 
tomar cualquier valor entero positivo. Por eso, y con objeto de que hos p; =1, es conveniente definir una clase 
extra con 8 o más errores para la cual: 


po = Pa (X >8)=1- Py, (X <7) = 0.001096 


Con las p, podemos formar la tabla de valores observados y esperados, Por ejemplo: E, = (100)(0.135335) 
= 13.5335, etc. 


Clase 0 1 2 3 4 5 6 7 8 o más 
(Número de errores) 

O, 15 27 25 20 de 3 1 2 0 

E, 13.5335 27.0671 27.0671 18.0447 9.0224 3.6089 1.2030 0.3437 0.1096 


Las últimas cuatro clases tienen valores esperados muy pequeños, por lo que conviene unirlas. En seguida se 
presentan la tabla resultante y los cálculos para la estadística de prueba. 


y 
O, 15 27 25 20 100 
E, 13.5335 27.0671 27.0671 18.0447 100 
O, — E; —0.0671 —2.0671 1.9553 0 
(O, - E, Y 0.0045 4.2729 3.8232 
2 
0.0002 0.1579 0.2119 1.0847 


O sea que xo =1.0847. Los grados de libertad se calculan en la tabla en que se ha obtenido la estadística de 
prueba. Esta tabla tiene 6 clases y se ha estimado un parámetro (2), por lo que los grados de libertad son 
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6—1—1= 4. El valor de xj es muy pequeño, y no se rechaza Ho con ningun & razonable. De hecho, el 
nivel observado de significancia es aproximadamente de 0.90, por lo que concluimos que el modelo Poisson 
representa adecuadamente los datos. 


Un comentario adicional es que la varianza de este conjunto de datos es 2.02, y la distribución de Poisson tiene 
la característica de que su media y su varianza son iguales. 6 


Ejemplo 13.19. Ahora hacemos una prueba de bondad de ajuste al modelo Normal para las edades del ejemplo 
13.16. Usando la tabla allí presentada, el primer paso es estimar 4 y a”, lo cual hacemos con las ecuaciones para 
datos agrupados. X y S° son: 


k 
2 fiv _ (23)(3) + (28)(42) +---+(63)(1) 
y P a 83 


= 32.70 


S Los? ++-+(1)(63)? —(83)(32.70 ] = 62.78 


S = 462.78 =7.92 


En el cálculo de $? se ha usado el divisor 7, y no 7—1, como ha sido lo usual en este texto. El estimador que 
usa el divisor 2 es llamado de Máxima Verosimilitud, y tiene mejores características para la aproximación a Ji- 
cuadrada, por lo que debe usarse en este caso. Otra recomendación es que la estimación de parámetros se haga 
siempre con datos agrupados, y nunca con las observaciones individuales. 


Las 2; se calculan entonces en una distribución N (32.7, 62.78). Aunque las 9 clases de la tabla sólo cubren de 
20.5 a 65.5, la distribución Normal puede tomar cualquier valor en (00,00), por lo que es necesario definir dos 
clases adicionales (— oo, 20.5] y (65.5, 00). Las p; para las 11 clases son entonces: 


20:5—32.7 
7.92 
Pa = Pay (20.5 < X £ 25.5) = P(-1.54< Z <-—0.91)=0.1196 


pi = Py (X £20.5)=P(Z < |= xZ -154 = 0.0618 
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Pio = Py, (60.5 < X < 65.5) = P(3.51< Z < 4.14) = 0.0001 
Pii = Pa (X > 65.5) = P(Z > 4.14) = 0.0001 


Las demás p, se calculan de manera similar. Las últimas cinco clases tienen valores esperados muy pequeños y 
se han unido en una sola, obteniéndose una tabla con k=7 clases para el cálculo de la estadística de prueba. 
Los valores observados, las p; los valores esperados y los cálculos para la obtención de la estadística se presentan 
en la Tabla 13.7. El valor de %3 es 56.5974, valor bastante extremo. Puesto que se estimaron dos parámetros, la 
estadística tiene cuatro grados de libertad. De la tabla de Ji-cuadrada obtenemos el valor de coo (4) = 14.8602 
, de modo que el nivel observado de significancia es mucho menor de 0.005, por lo que es razonable rechazar 
Ho y concluir que la distribución Normal no es un modelo adecuado para estos datos. De hecho, el histograma 
de los datos es marcadamente asimétrico. 


Tabla 13.7. Cálculos para una prueba de bondad de ajuste a la distribución Normal. 


2 

Clase o $ E, 0-5 (Ep OEL 
Menos de 20.5 0 0.0618 5.1294 —5.1294 26.3107 5.1294 
20:5: 255] 3 0.1196 9.9268 6.9268 47.9806 4.8334 
(25.5, 30.5] 42 0.2083 17.2889 24.7111 610.6385 35.3197 
(30.5, 35.5] 21 0.2471 20.5093 0.4907 0.2408 0.0117 
(35.5, 40.5] 7 0.1997 16.5751 =95751 91.6825 5:5313 
(40.5, 45.5] 3 0.1109 9.2047 —6.2047 38.4983 4.1825 

11 

Más de 45.5 7 È p=0.0526 4.3658 2.6342 6.9390 1.5894 
z 83 1.0000 83 0 56.5974 


La segunda aplicación de la distribución de Ji-cuadrada a datos categorizados que consideraremos, es útil cuando 
en cada elemento de la muestra se observan simultáneamente dos características, para cada una de las cuales se 
tiene un cierto número de categorías o clases mutuamente excluyentes, de manera que con las observaciones 
puede elaborarse una tabla de frecuencias de doble entrada como las estudiadas en la sección 2.4. En esta nueva 
situación a dichas tablas se les llama Tablas de Contingencia. Para ilustrar el tipo de situaciones a las que nos 
referimos presentamos un ejemplo. 
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Ejemplo 13.20. En una escuela se toma una muestra aleatoria de tamaño 200, usando un padrón que incluye 
profesores y estudiantes. A cada individuo en la muestra se le pregunta si es profesor o estudiante, y si considera 
que el nivel académico de la escuela es deficiente, regular o excelente. En la tabla siguiente se presentan los 
resultados. 


Deficiente Regular Excelente Y 


Profesor 40 10 0 50 
Estudiante 60 70 20 150 
y 100 80 20 200 


La pregunta que se plantea con este tipo de tabla es la siguiente: ¿la opinión sobre el nivel académico es la misma 
entre profesores y estudiantes? Dicho de otro modo: ¿son independientes los dos criterios de clasificación? La 
generalización de estas tablas de contingencia y el método para concluir sobre la pregunta planteada ocuparán 
las siguientes páginas. 6 


La tabla del ejemplo 13.20 tiene 2 hileras y 3 columnas, por lo que decimos que es una tabla de contingencia 
2X3. En general diremos que una tabla de contingencia es Xc si tiene A hileras y c columnas. Para esto 
consideramos que cada una de las observaciones puede clasificarse de acuerdo con dos características, para la 
primera de las cuales se tienen / categorías mutuamente excluyentes, mientras que se tienen c para la segunda. 
Usando una adaptación de la notación usada en la prueba de bondad de ajuste, una tabla de contingencia hXc 
puede representarse como sigue: 


Tabla 13.8. Una tabla de contingencia hXc 


Columna 
Hilera o q e bY 
1 AA 
1 f1 "n nic m, 
2 ny ny ny m, 
h ngi Ah Abe UA 
y na A) Ae n, =n 
c h 
En la Tabla 13.8, »,, = Y; i=llh; n= A j=1,2,...,€ y N=n, = S iji o sea el tamaño de 
j=l = i j 


la muestra. 


Las probabilidades (desconocidas) de las celdas se representan en la Tabla 13.9. 
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Tabla 13.9. Probabilidades en una tabla de contingencia hXc 
— 


Hima — P y 
z Pa Pa Pac P2 
h Ph Ph ste Phe Ph. 


De acuerdo con lo aprendido en el capítulo 4, las características que se tienen en hileras y columnas son 
independientes si para cualquier celda, digamos la localizada en la hilera ¿ésima y columna j-ésima, su 


probabilidad p,; es tal que: 
Pi = PiPo; 


y esto debe cumplirse para todas y cada una de las /Xc celdas en la tabla. La hipótesis que probaremos es 
entonces: 


Ho: Pij = Pj.p.; para toda i y toda j. 
Ha: p; Æ pip. ¡» al menos para una celda. 


Al igual que en la prueba de bondad de ajuste, la estadística de prueba se basa en las frecuencias observadas nij 
y las esperadas, que serían np; Nótese que puesto que Ho no especifica los valores de Pip €s necesario estimar 


parámetros para calcular los valores esperados Æ; bajo Ho. Puesto que bajo Ho, Pij = Pi. p.j» los parámetros 


a estimar son Pj,, Po. Py Y Parr Puz>===» Pac» SÓlO que, puesto que S »,. =1 y Y». =1, únicamente es 


necesario estimar /4—1+c—1=)+c—2 parámetros. 


El estimador que usamos para p,. es: 


a e 
> EIA 
n (13.23) 
y para p.j: 
A A, j 
fg = 
e (13.24) 
De donde el valor esperado £; bajo Ho es: 
A AA n. Maj Ni, ; 
Bo= e — Mie A J 
ij apy nP Py n n n n (13.25) 


20. 
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Es decir, que para obtener el valor esperado en una celda basta multiplicar el total de su hilera por el total de su 
columna y dividirlo por el tamaño de la muestra. 


La estadística de prueba es: 


e (7; — E, ) 


A=AA 
mja Ey (13.26) 


es decir, una suma sobre las hXc celdas, que refleja las discrepancias entre los valores observados (n, j) y los 


esperados bajo Ho( E; . KG, tiene una distribución aproximada que es Ji-cuadrada. Para obtener los sacos de 
P J 0 P q 8 
b è 


libertad notamos que hay Xc celdas, con una restricción, ya que n, =n y se han estimado h+c=2 
q y ya q ij y 
¡=1/=1 
parámetros. El número de grados de libertad es entonces: 


Número de celdas - 1 - (número de parámetros estimados para especificar las Pij) 
= hc—l1—-(h+c—2)=bc—-h-c+1 


=(4—1)(c—1) 
La regla de decisión para la prueba es: 


Rechazar Ho six > x [(b-1)(c-1)]. 


Ejemplo 13.21. En seguida aplicamos la prueba a los datos del ejemplo 13.20. Los datos son: 


X 


Estudiante 150 
60 70 20 
z 100 80 20 


Ho: pj = pip. 511,2, =1,2,3. Ha: p; % PiP. j» para algún par (i, 5). 


Los valores E; son: 


m.n _ (50)(100) 


y AE 
14 n 200 


RE m.n. _ (50)(80) 


= =20 
j n 200 
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_ 3 m (50)(20) $ 


n 200 
E, 2% a pua ce 
qa pta a pruna id 
E, = 7 - (15000) _ ,¿ 


n 200 
Estos valores esperados se han colocado en recuadros dentro de cada celda. El valor de la estadística de prueba es: 


5552 sit e2 Jami 
=$ 25) ¿010 20) ¿0 5) ¿(60 75) 


25 20 5 75 
0-60? (20-15? 
20. BO. as 
60 15 


En este caso /h=2 y c=3, por lo que se tienen 2 grados de libertad. De la tabla de y? obtenemos, con 
a =0.005, Xó.005(2) =10.5966, por lo que se rechaza Ho con æ = 0.005 y, de hecho, el nivel observado de 
significancia es mucho menor. La conclusión es que la opinión sobre el nivel académico no es independiente de 
que el individuo sea profesor o estudiante. Examinando la tabla con valores observados y esperados puede verse 
que el rechazo de la hipótesis de independencia se debe a que entre los profesores predominan las opiniones que 
califican de bajo el nivel académico, mientras que entre los estudiantes se da el fenómeno opuesto, aunque no de 
manera tan marcada. En este análisis, posterior al rechazo de Ho, juegan un papel muy importante las diferencias 


O, — E;» así como los signos de las mismas. 4 


La última aplicación de la distribución de Ji-cuadrada a datos categorizados que estudiaremos aquí, se aplica 

también a datos organizados en una tabla de contingencia. La única (pero muy importante) diferencia es que 

los totales marginales de una de las clasificaciones están predeterminados antes de realizar el experimento o 

de tomar la muestra. En la situación más típica se toman muestras aleatorias independientes de cada una de 
h 


h poblaciones, siendo las muestras de tamaños My, nas.. Np, donde Y», =n. Cada elemento, en cualquiera 
i=l 
de las muestras, puede clasificarse en una de c categorías mutuamente exclu entes. Se obtiene así una tabla 
P 8 y 
de contingencia Xc, donde los totales de hilera ¿EA n, ) están fijos antes de tomar la muestra. Se dice 


entonces que se tiene una Tabla de Contingencia con uno de los márgenes fijo. La estructura de los datos es la 
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misma que en la tabla 13.8, excepto que cambiaremos algo la notación; por ejemplo para los totales de hilera, 
que ahora serán simplemente 7 , 2,,..., 7}, para resaltar que en este caso son tamaños de muestra prestablecidos 
(constantes) y no variables aleatorias. La tabla de contingencia es ahora: 


Tabla 13.10. Tabla de contingencia con totales de hilera fijos 


Clase 
Población —————————— > 
1 2 t c 
ni ni2 Mic ni 
2 m n2 Me ni 
h 251 ni Mhe A, 
$ c 6 c, n 


Lo que se modifica radicalmente es la estructura probabilística de la tabla, ya que si un individuo es de la 
población ¿-ésima, forzosamente aparece en esa hilera. De hecho, cada hilera de la tabla 13.10 tiene una 
estructura multinomial, y los datos observados en cada hilera son una muestra de una multinomial con 


parámetros desconocidos P;;» P;2»=»»*» Pje, donde 2 pj =1 para i= 1,2,...,/. La tabla con las probabilidades Pij 
e 
se presenta enseguida. 


Tabla 13.11. Probabilidades en una tabla de contingencia 


con los totales de hileras fijos 


Clas. 
Población ————— 4 — > 
1 2 “e. c 
1 Pin Pra Pic 1 
2 Pa 22 Px l 
h hi h2 he 1 


(En la Tabla 13.11 la suma de las columnas no está fija ni tiene ningún sentido.) 


Con esta nueva estructura de datos, lo que interesa es comparar las / poblaciones con respecto al criterio 
de clasificación elegido para formar las columnas, problema que enfocamos como el de la comparación de 
las probabilidades de las celdas de / multinomiales. La prueba que resultase se llama entonces Prueba de 
Homogeneidad. El juego de hipótesis por probar es: 


Ho: pi; = Pp == pyi ¡=1,2,...,0 


Ha : Probabilidades distintas al menos en una columna. 


Nótese que si Ho es cierta, la implicación es que se tienen / multinomiales con las mismas probabilidades en las 
celdas respectivas o, desde un punto de vista más práctico, que las poblaciones son iguales con respecto al criterio 


de clasificación adoptado para formar las columnas. 
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Por abreviar no entraremos a la derivación de la estadística de prueba. Sólo asentamos que es la misma que en el 
caso de la prueba de independencia, es decir, que se usa: 


hc (n; Ej) 
ij ij 
Xo = 22, E 
¡=1j=1 ij 
donde, con la notación de la Tabla 13.10: 
nic; 
a 


y la regla de decisión es de nuevo: 


Rechazar Ho si xe > x2 [(b-1)(c-1)] 


Los grados de libertad para la estadística de prueba son los mismos que en la prueba de independencia, aunque 
la justificación es distinta. Ahora sólo se estiman c —1 parámetros, pero hay / restricciones, una por hilera. En 
resumen, el procedimiento para una prueba de homogeneidad es idéntico al que se usa en una prueba de Ji- 
cuadrada para independencia. Lo que cambia es la formulación de la hipótesis por probar y, consecuentemente, 
la interpretación de los resultados, según puede verse en el ejemplo 13.22. 


Ejemplo 13.22. En una localidad existen agricultores que tienen tierras de riego, otros que cultivan tierras 
de temporal y, finalmente, un grupo que trabaja bajo una condición mixta llamada Medio Riego. Usando 
un padrón donde se asientan los nombres de los agricultores y a cuál de estas tres poblaciones pertenecen, 
se toman muestras de 25, 40 y 35 agricultores de las poblaciones mencionadas. Se entrevista a cada uno de 
los 100 y se les hacen preguntas tendientes a identificar el nivel de tecnología que usan en su explotación. La 
escala utilizada establece cuatro niveles tecnológicos: Nulo, Pobre, Mediano y Alto. Los resultados se resumen 
a continuación. 


ba Nivel de Tecnología 
Población 


Mediano z 


2 


n;C 


., i | , . 
Los valores esperados (en recuadros en la tabla) se han calculado usando la ecuación Æ; — . Así, por ejemplo: 
n 


40)(28 
yy = 2 PO 
n 100 
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-a 


m0 _ (85)06) _ 


Eso 9.1 
sa n 100 
Los cálculos para obtener x¿ se presentan abajo. 
ceca O, E O,=E, (0,-E,Y (0-5 
(i,) á e ¿Ds E, 
(1,1) 3 TO -45 20.25 2.7000 
(1,2) 4 6.5 29 6.25 0.9615 
(1,3) 10 7.0 3.0 9.00 1.2857 
(1,4) 8 4.0 4.0 16.00 4.0000 
(2,1) 15 12.0 3.0 9.00 0.7500 
(2,2) 10 10.4 —0.4 0.16 0.0154 
(2,3) 10 11:2 =1.2 1,44 0.1286 
(2,4) 5 6.4 1.4 1.96 0.3063 
(3,1) 12 10.5 1.5 2.25 0.2143 
(3,2) 12 9.1 2:9 8.41 0.9242 
(3,3) 8 9.8 —1.8 3.24 0.3306 
(3,4) 3 5.6 —2:6 6.76 1.2071 
y 100 100 0 12.8237 


Entonces %6 =12.8237 con (3-1)/(4-1)=6 grados de libertad, para probar Ho: Pij = Pj F Pays 
j=1,2,3,4, es decir, que las 3 poblaciones tienen la misma proporción de uso de tecnología en el nivel nulo, 
en el nivel pobre, etc. De la tabla de Ji-cuadrada obtenemos %;.p5(6) =12.5916, por lo que el nivel observado de 
significancia es aproximadamente de 0.05, o sea que con cualquier œ mayor de 0.05 se rechaza Ho y se concluye 
que el nivel de tecnología usado es diferente entre poblaciones. 


Un análisis detallado de las diferencias O; — E; nos sugiere que el rechazo de Ho se debe a que la población de 
agricultores con tierras de riego usa niveles más altos de tecnología que las otras dos. Más aún, del valor total 
de %3 (12.8237), el 69.77% (8.9472) se obtiene de contribuciones en la primera población, por lo que parece 
razonable pensar que las otras dos poblaciones son iguales en cuanto a nivel tecnológico y distintas de la primera. 
Por supuesto, una conclusión formal sólo puede obtenerse mediante un análisis más detallado, del cual no nos 
ocuparemos aquí. 0 


Finalizamos el capítulo con comentarios sobre el uso de la distribución de Ji-cuadrada en pruebas de 
homogeneidad. 


a) La distribución Ji-cuadrada se usa como aproximación a la de x¿. Cuando hay valores E, muy pequeños 
(5 o menos), la aproximación no es muy buena. En ese caso, y siempre que sea razonable, se recomienda 
unir clases (columnas) para obtener valores esperados mayores. Así, en el ejemplo 13.22, dado que la 
escala usada para nivel de tecnología es ordinal, sería razonable (en caso necesario) unir las columnas con 
los niveles Nulo y Pobre, pero sería absurdo unir las que tienen los niveles Nulo y Alto. 


b) Cuando se rechaza Ho se concluye (al nivel de significancia especificado) que las poblaciones no 


13,1, 
13,2, 
133 
13.4. 
13.7 


13.6. 
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son homogéneas con respecto al criterio de clasificación elegido, pero no sabemos cuál (o cuáles) 
población(es) causa(n) la heterogeneidad. El siguiente paso lógico sería analizar subconjuntos de la tabla 
de contingencia. Se remite al lector interesado a la referencia 13.6. 
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Ejercicios 


13.1, 


13:2. 


13.3. 


Decida qué escala de medición se tiene en cada uno de los siguientes casos: 


a) Se inspeccionan rectángulos de terreno de 3X1 m y se registra la cantidad de vegetación como 
escasa, regular o abundante. 


b) Se pregunta a cada una de 100 personas cuál de cuatro partidos políticos prefiere. 


c) Se registra la potencia de un tóxico en relación con la de un estándar internacional, es decir, el 
número de unidades (mg, por ejemplo) por kg de peso del tóxico (relativo al estándar) que se 
requieren para matar a un individuo. 


d) Se pide a diferentes personas que califiquen el sabor de dos alimentos en una escala del 1 al 10, 
de acuerdo con sus preferencias individuales. 


e) A 5 catadores se les presentan dos platos idénticos con un alimento. La única diferencia es que el 
alimento en uno de los platos tiene un antioxidante. Se registra, para cada catador, si detectó o 
no el antioxidante. 


f) Se registra la relación paja/grano en unidades experimentales con una variedad de trigo. 


g) Se cuenta el número de lesiones causadas por un hongo en plantas de cacao. 


Demuestre, ya sea directamente o por inducción, la expresión 13.1. Es decir, pruebe que: 


k 
Sy HD 


Suponga que se tienen dos muestras independientes X,,X,,X3 y Y,,Y,,Y,,Y¿, medidas en una 


escala (al menos) Ordinal: 


a) ¿Cuántos ordenamientos posibles de las siete observaciones hay, de acuerdo con los rangos? 


(3)(4) 


3 
b) Calcule $, = SR (X;) para cada posible ordenamiento, y T, = S, — z 


i=l 


c) Presente la función de probabilidades de T,, suponiendo que las dos poblaciones son iguales. 


d) Suponga que se quiere probar Ho: My = My en oposición a Ha: My = My. Encuentre una 
regla de decisión (con igual probabilidad en ambas colas) que le garantice un nivel de significancia 
a = 2135 = 0.057 . ¿Qué nivel de significancia tiene esa prueba de acuerdo con la Tabla J? 


13.4. 


19.5 


13.6. 


13:7. 
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En un experimento (Science, Vol. 168, 19 de junio de 1970, pág. 1466) se trató de determinar 
la efectividad de una secreción de una avispa (Mischocyttaurus drewseni) como repelente contra 
hormigas. El experimento consistió en disponer 32 tubos capilares de 65 mm de largo en posición 
vertical, colocando en el fondo un pequeño trozo de nuez de Brasil. 15 tubos fueron frotados con 
la secreción y 17 fueron usados como testigos. Los tubos se colocaron en una habitación donde las 
hormigas (Monomorium pharaonis) estaban presentes en grandes cantidades. Se observaron los tubos 
hasta que 10 hormigas llegaban al fondo y alcanzaban el cebo. Los datos que se presentan son los 
números de hormigas por tubo que iniciaron el ascenso del tubo, pero desistieron. 


Número de hormigas que no alcanzaron el cebo 
24, 44, 63, 51, 5, 17, 10, 37, 2, 3, 72, 11, 16, 25, 8. 
2.7 3% 5 4 186,3 6 3 LL 2 


Tratamiento 


Secreción de M. drewseni 


Testigo 


Pruebe la hipótesis siguiente: la secreción de la avispa es un repelente efectivo (æ = 0.001). Use la 
prueba de Mann y Whitney. 


Construya un intervalo con nivel de confianza 0.998 para la diferencia de medianas con los datos 
del ejercicio 13.4, usando la prueba de Mann Whitney. Calcule también el intervalo con nivel de 
confianza 0.950. 


Use la técnica paramétrica para dos muestras independientes (suponiendo distribución Normal 
P P 
para construir intervalos con niveles de confianza 0.998 y 0.950 para la diferencia de medianas con 
los datos del ejercicio 13.4. Compare sus resultados con los del ejercicio 13.5. ¿Qué suposiciones es 
J ¿ P 
posible que no se cumplan para el uso correcto de esta técnica? 


Los siguientes datos son determinaciones de “valor biológico” y coeficiente de digestibilidad en 10 
muestras de maíz desgrasado y 10 muestras de soya procesadas en un autoclave. 


Tratamiento Valor biológico 


Tratamiento Coeficiente de digestibilidad 


a) Pruebe la hipótesis de que los tratamientos son iguales por lo que toca a “valor biológico”, usando 
una prueba de Mann y Whitney (a = 0.001). 


b) Repita el inciso 4) para la variable “coeficiente de digestibilidad”. 


en 
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Construya intervalos de confianza (œ = 0.001) para la diferencia de medianas de tratamientos para 
ambas variables en el ejercicio 13.7. Interprete sus intervalos en relación con las pruebas de hipótesis 
en 13%, 


Con los datos del ejercicio 13.4 pruebe de nuevo la hipótesis de que la secreción de la avispa es un 
buen repelente, pero ahora use la aproximación Normal para la estadística T. Calcule Or, Con y sin 
la corrección para empates. Calcule los niveles observados de significancia. 


En algunos estudios sobre el crecimiento de levaduras se utiliza un índice de turbidez del medio 
como medida del crecimiento de la levadura. En el siguiente experimento se estudió el efecto de tres 
concentraciones del herbicida 2—4— D (ácido 2-4 diclorofenoxiacético) sobre el crecimiento. Los 
resultados fueron: 


Medidas de turbidez 
Tratamiento 
Tèstig 10 ppm 100 ppm 
19 25 46 
28 23 47 
19 23 43 
20 24 48 


22 


Use una prueba de Kruskal-Wallis para probar la hipótesis de que los tratamientos son iguales. 
Calcule el nivel observado de significancia usando la Tabla K, y también con la aproximación de Ji- 
cuadrada. ¿Hay evidencia suficiente para concluir que el 2—4-— D afecta el crecimiento? Se supone 
que el crecimiento y la turbidez están directamente relacionados. 


(Comparaciones múltiples. Relación entre Mann-Whitney y Kruskal-Wallis). Considere los datos del 
ejercicio 13.10. Aquí, al igual que en un A de V paramétrico, habiendo decidido que hay diferencias 
entre los tratamientos nos encontramos con el problema de saber cuál o cuáles de ellos ocasionan la 
significancia. Una solución, aunque no la óptima, consiste en hacer todas las comparaciones de dos 
en dos, tomando niveles de significancia inversamente proporcionales al número de comparaciones. 
En este caso la prueba de Kruskal-Wallis se reduce a la de Mann-Whitney. 


Aplique sendas pruebas de Mann-Whitney a los tres posibles pares de tratamientos. Para mantener 
(aproximadamente) un nivel 4=0.15 en la conclusión general, use 7,16 y Ti-a; como valores 
críticos, o sea Ty 975 y 70.975. En general, para hacer / comparaciones simultáneas, con nivel æ, use 


Toni y Ti-a/2 


a) En la comparación de Mann-Whitney para 10 ppm en oposición a 100 ppm verifique que: 
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2 
nm 


ES 
2 | =r i 
nmin+m>+1) C) 


12 


Donde T, es la estadística de Mann-Whitney y T es la de Kruskal-Wallis. O sea que para 2 
tratamientos, T es simplemente el cuadrado de la estadística T, estandarizada, que tiene 
distribución aproximadamente normal para » y m grandes, y por tanto T tiene distribución 
aproximada Ji-cuadrada. Para más de dos tratamientos tenemos que recurrir a Ji-cuadrada, 
aprovechando su propiedad aditiva. 


La expresión (*) es cierta en general, siempre que no haya empates, y aproximada cuando hay 
pocos empates. 


13.12. En seguida se presenta el número total de nacimientos naturales por día de fase lunar durante un 
periodo de 4 años en el hospital de la Universidad de California (Los Angeles). Aquí hemos formado 
cuatro grupos a guisa de tratamientos, que son: A, los primeros 5 días del ciclo; B, del día sexto al 
décimo; C, del decimoprimero al vigésimo día; D, del vigésimo primero al trigésimo día. (Fuente: 
adaptado de The skeptical inquirer, verano de 1979). 


Tratamiento (días de fase lunar) 


A B G D 
[1,5] [6, 10] [11, 20] [21, 30] 
(Número de nacimientos) 

273 282 243 241 

273 293 292 252 

291 276 261 268 

287 260 279 294 

270 271 268 265 
270 305 
276 280 
290 285 
278 264 
303 287 


Use una prueba de Kruskal-Wallis para decidir si hay diferencias en el número de nacimientos en los 
diferentes periodos. ¿Hay en estos datos algún apoyo para la creencia popular de que nacen más niños 
en el periodo de luna llena? El intervalo [11, 20] está centrado en ese periodo. 


13.13. Después de que en una ciudad se han realizado cambios extensos en las reglas para la circulación 
de vehículos, se toma una muestra de 27 conductores de transporte urbano y se les pregunta si la 
circulación ha mejorado. De los 27, 16 responden afirmativamente, nueve que ha empeorado y dos 
que no ha cambiado. Use una prueba del signo para decidir si la muestra arroja evidencia suficiente 
para concluir que la circulación ha mejorado « = 0.05. 
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13.15 


13.16. 
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En una investigación emprendida para cuantificar diferentes aspectos de la fertilidad de 
poblaciones humanas en los Estados Unidos de Norteamérica se registró, entre otras variables, 
la tasa de nacimientos vivos (por cada mil personas) en individuos de raza blanca y raza negra 
en 20 ciudades diferentes. Note que difícilmente puede suponerse que ésta es una muestra 
aleatoria. 


Tasa de nacimientos vivos 


Ciudad Blancos Negros 
Akron 15.0 17.0 
Baltimore 16.3 21,7 
Boston 22.0 19.8 
Buffalo 17.6 22.5 
Chicago 13.9 1/<Y 
Cincinatti 16.8 14.6 
Cleveland 16.6 16.2 
Columbus 15.8 16.9 
Detroit 15.8 16.9 
Indianapolis 16.0 17.5 
Jersey City 20.9 26.5 
Louisville 17.0 15.7 
Memphis 17.5 18.3 
Nashville 22.1 19.7 
New York 15.3 19.4 
Philadelphia 15.9 19.5 
Pittsburgh 19.3 19.7 
St. Louis 15.2 18.0 
Toledo 14.9 13:59 
Washington 19.1 24.6 


Fuente: Science, Vol. 83, pág. 505, 22 de mayo de 1936. 


a) Suponga que ésta es una muestra aleatoria de ciudades. Use una prueba del signo para decidir si 
hay diferencia entre las tasas de nacimientos. Calcule el nivel observado de significancia. 


b) ¿Cree usted que la prueba del signo utiliza adecuadamente la información de esta 
investigación? 


Use una prueba de Wilcoxon para probar la misma hipótesis que en el inciso 4) de 13.14. æ = 0.05. 
Calcule el nivel observado de significancia. ¿Qué suposición extra hubo de hacer para usar esta prueba 
en vez de la del signo? 


Use la prueba de Wilcoxon para construir un intervalo con nivel de confianza 0.95 para la mediana 
de las diferencias entre las tasas de nacimientos de las poblaciones en el ejercicio 13.14. Relacione el 
intervalo obtenido con el resultado en 13.15. 


13:17. 


13.18, 


13.19, 


13.20. 


13:21, 


13.22. 
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Pruebe la misma hipótesis que en 13.15 mediante la prueba de Wilcoxon, pero ahora, en vez de usar 
la tabla con la distribución exacta de la estadística 7, use aproximación Normal para 7. Calcule el 
nivel observado de significancia. 


En seguida se presentan porcentajes de mortalidad de moscas expuestas a rociado de DDT. Se tienen 
dos “razas” de moscas: una, llamada Normal, es mosca común; la otra, llamada aquí Especial, ha sido 
seleccionada para resistencia durante 14 generaciones. Se hicieron ocho observaciones apareadas para 
moscas de cuatro días de edad y otras ocho, también apareadas, para moscas de cinco días de edad. 
Los datos se presentan a continuación (Fuente: Science, marzo 12 de 1948, pág. 276). 


Moscas de cuatro días de edad 


Prueba 
Raza 
1 2 A 4 5 6 7 8 
Normal 69 77 65 87 49 66 78 55 
Especial 38 22 41 19 17 37 41 19 
Moscas de cinco días de edad 
Prueba 
Raza 
1 2 3 4 5 6 7 8 
Normal 75 78 76 51 67 70 68 70 
Especial 52 41 35 420 bd m 25 


Para cada conjunto de datos pruebe la hipótesis de que las moscas seleccionadas tienen mayor 
resistencia, es decir, menor porcentaje de mortalidad. œ = 0.01. 


Tanto para las moscas de cinco días de edad como para las de cuatro (en el ejercicio 13.18) 
calcule intervalos de confianza para la mediana de las diferencias de porcentajes de mortalidad. 
1=a=0.95, 


Use los datos del ejercicio 13.18 de la siguiente forma: para las moscas de la raza “Especial” utilice 
una prueba de Mann y Whitney, para decidir si hay diferencia en porcentaje de mortalidad entre las 
de cuatro y cinco días de edad, construyendo un intervalo con nivel de confianza 0.95. Concluya. 


Use una prueba de Wilcoxon modificada para una sola muestra para decidir, con los datos del 
ejercicio 13.18, si el porcentaje de mortalidad de las moscas de la raza “Especial” de cuatro días de 
edad es menor de 32 %. a = 0.05. 


Use una prueba de Wilcoxon modificada para una sola muestra para calcular un intervalo de 
confianza para el porcentaje de mortalidad de moscas de raza “Normal” de cinco días de edad en el 
ejercicio 13.18. En este caso las D; son las mismas observaciones. Use & = 0.05. 
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(Distribución de la estadística de Wilcoxon bajo la hipótesis nula). La prueba de Wilcoxon considera las 
diferencias dentro de pares, D; = Y, — X; (i = i.. n). Si la hipótesis nula, Ho: Mp =0, es cierta, 
entonces P(D, >0)=P(D, <0)=1/2. 


La estadística es: 


donde: 


R= 


1 


0siD,<0 
R, siD,>0 


y R; es el rango asignado a | D; |; por lo que, bajo Ho,P(R' = R) = P(R = 0) =1/2. 


Dada la suposición de que la distribución de las D; es simétrica, los rangos asignados a las D; son 
independientes del signo de D; además, R, puede tomar valores (enteros) entre 1 y 2, y R; puede 
tomar el valor cero o el valor R, Es decir, que cada R; puede tomar dos valores (0 o R). Hay entonces 
2” posibilidades para calcular 7, y todas tienen la misma probabilidad (bajo Ho), o sea 1/2”. Por 
ejemplo, con 2 = 3 hay ocho resultados posibles. 


Configuración de las R; Probabilidad 


T 

0 1/8 
1 1/8 
2 1/8 
3 1/8 
3 1/8 
á 1/8 
5 1/8 
6 1/8 


-OoOo.m..=.oo0o0onm o 
N N GOG LU OUO O 
UY UY wW O YO Oo oO 


a) Para n= 5, escriba los 32 resultados posibles y calcule la distribución de T bajo la hipótesis nula. 

b) Para una prueba de Ho: Mp <0 en oposición a Ha: Mp > 0, encuentre la regla de decisión 
que da un nivel de significancia de 0.09375. ¿Qué nivel se atribuye a esa prueba en la Tabla L? 
¿Cuál es la razón de la discrepancia? 

c) Compare la distribución obtenida en a) con la segunda hilera de la Tabla L. 


(Media y varianza de la estadística de Wilcoxon). De acuerdo con las consideraciones hechas en el 
ejercicio 13.23, es fácil probar que, bajo Ho: 
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Á R 
E(R )=> 
var(R)= Ë. 


De aquí pruebe que la media y la varianza de T = hu R son las establecidas en las ecuaciones (13.11) 
y (13.12), es decir: i=l 


_nn+l) 
MT Na 


2 Mn+1)Qn+1) 
r5- 


A +1)Qn+1 
Pista: Use la siguiente igualdad: Exa - Cn 
i=l 


13.25. En un estudio sobre hombres de ciencia en los Estados Unidos de Norteamérica, se pidió a cada 
uno de un grupo de 10 observadores que externara su juicio sobre cada uno de 10 astrónomos, 
asignándoles números enteros entre 1 y 10 de acuerdo con sus merecimientos científicos. Los 
resultados se presentan enseguida. 


Astrónomo 
Observador : i HI IV V VI VI VII IX 
4 1 2 á 3 9 6 8 5 10 FA 
B 1 4 2 5 6 10 9 3 8 7 
C 1 4 3 5 2 8 6 9 7 10 
D 9 2 4 3 1 5 7 10 8 6 
$ i a á 5 6 3 8 4 7 D 
F 1 4 9 2 5 6 3 7 8 10 
G 1 3 5 10 2 6 7 9 4 8 
H 1 3 5 7 6 4 9 10. 8 2 
I 1 2 8 4 9 6 7 3 10 5 
J 1 2 4 5 9 8 3 10 7 


Fuente: Adaptado de Science, Vol. XXIV, Núm. 622, pág. 699, 30 de noviembre de 1906. 


Use una prueba de Friedman para decidir si, de acuerdo con los jueces, hay diferencia entre los 
merecimientos científicos de los astrónomos. & = 0.01. 


13.26. En un almacén de ropa se va a adquirir nuevas máquinas registradoras, y la administración se 
encuentra indecisa entre tres modelos distintos. Para comparar los modelos se instala un ejemplar 


Ly. 
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de cada uno. En cada uno de tres días sucesivos una cajera opera cada modelo, y la experiencia 


se repite con 5 cajeras. Se registra el número de errores cometidos. Los resultados se presentan a 
continuación. 


Número de errores 


Cajera Makt 
I II II 
1 15 19 17 
2 25 28 27 
3 19 18 24 
4 12 13 19 
5 8 9 12 


Use una prueba de Friedman para decidir si hay diferencias entre los modelos por lo que toca al 
número de errores cometidos. æ = 0.10. ¿Cómo probaría la hipótesis de que hay diferencia entre los 
modelos I y II? (Ver ejercicio 13.11). 


13.27. En el ejercicio 13.12 se analizaron (mediante una prueba de Kruskal-Wallis) los nacimientos en 
diferentes periodos de fase lunar en el hospital de la Universidad de California (Los Angeles). En 
seguida reproducimos el total de nacimientos en cada uno de los 30 días del mes lunar en dicho 
hospital, del 17 de marzo de 1974 al 30 de abril de 1978. 


—__—_————————————————————————————__———————————_— o _ __ o _— _____ ua QQ 


Día lunar 1 2 3 4 5 6 7 8 9 10 
Nacimientos 273 273 291 287 270 282 293 276 260 271 
Día lunar 11 12 13 14 15 16 17 18 19 20 
Nacimientos 243 292 261 279 268 270 276 290 278 303 
Día lunar 21 22 23 24 25 26 27 28 29 30 


Nacimientos 241 252 268 294 265 305 280 285 264 287 
A A - 6. Oó?IZÍ9Dy:gq 32ZZmHZ= Ez A O Ys Cord 


Pruebe la hipótesis de que no hay diferencia en el número de nacimientos para los diferentes días del 
mes lunar.  = 0.05. Use una prueba de Ji-cuadrada. 


13.28. En un estudio sobre la distribución espacial de larvas de un insecto (Tribolium confusum) en harina 
de trigo, se distribuyó una lámina uniforme de harina en una superficie. Después de un tiempo, 
se cuadriculó la superficie en 100 unidades iguales y se contó el número de larvas por unidad. 
Los resultados se presentan en forma de tabla de frecuencias (datos cortesía del Dr. Jorge Vera 
Graziano). 
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Núm. de larvas Núm. de cuadros Núm. de larvas Núm. de cuadros 


(X,) (4) (X,) (£) 
0 2 5 16 
1 6 6 14 
2 10 7 9 
3 15 8 5 
4 18 9 5 


Use la prueba de Ji-cuadrada para decidir si los datos pueden ser bien representados por una Poisson. 
Encuentre el nivel observado de significancia (aproximado). 


13.29. La siguiente tabla de frecuencias resume 200 mediciones de la longitud de grano de polen (en micras) 
de un abeto (Picea canadensis). 


Clase Frecuencia Clase Frecuencia 
(63.2, 64.8] 1 (79.2, 80.8] 13 
(64.8, 66.4] 3 (80.8, 82.4] 10 
(66.4, 68.0] 6 (82.4, 84.0] 7 
(68.0, 69.6] 9 (84.0, 85.6] 5 
(69.6, 71.2] 16 (85.6, 87.2] 4 
(71.2. 72.8] 20 (87.2, 88.8] 3 
(72.8, 74.4] 24 (88.8, 90.4] 2 
(74.4, 76.0] 29 (90.4, 92.0] 1 
(76.0, 77.6] 26 (92.0, 93.6] 1 
(77.6, 79.2] 19 (93.6, 95.2] 1 


Fuente: Science, Vol. 108, pág. 116. 30 de julio de 1948. 


Calcule la media y varianza de los datos y pruebe bondad de ajuste a la distribución Normal con las 
estadísticas calculadas. œ = 0.05. 


13.30. La siguiente tabla resume las calificaciones obtenidas por 10 millones de reclutas que tomaron la 
prueba general de aptitudes del ejército durante la segunda Guerra Mundial en los Estados Unidos 
de Norteamérica (Fuente: Science, Vol. 104, Núm. 2694, 16 de agosto de 1946, pág. 148). 


Clase Frecuencia 

70 o menos 880 000 
(70,901 2 850 000 
(90,1101 3 070 000 
(110,1301 2 620 000 


Más de 130 580 000 
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Decida si la distribución de calificaciones puede representarse bien por una Normal con u=100 y 
a = 20. Puesto que no es necesario estimar los parámetros, la estadística resultante tiene 4 grados de 


libertad. 


13.31. Thorndike (Science, Vol. XXIII. Núm. 596, págs. 839-845, 1906) examina la relación entre las 
calificaciones obtenidas por 130 estudiantes en sus exámenes de admisión a la Universidad de 
Columbia y el promedio obtenido por cada uno de esos estudiantes en los diferentes años de su carrera 
universitaria. En seguida presentamos una tabla de contingencia 4X3, donde en las hileras se generan 
intervalos usando las calificaciones del examen de admisión y en las columnas se usan las calificaciones 
obtenidas por los 130 estudiantes en su tercer año en la Universidad. Las calificaciones del tercer año se 
han obtenido asignando arbitrariamente los valores 6, 4, 3, 1 y cero a las letras A, B, C, D, y F con que 
usualmente se califica en las universidades norteamericanas, y sumando las 5 calificaciones más altas de 
cada estudiante. Las calificaciones del examen de admisión están medidas en una escala del cero al cien. 


Examen de admisión Tercer año 
6 o menos 17123 24a30 
60 a 68 13 9 3 
69276 14 21 nl 
77 a 84 5 2 a 
85 a 100 l i + 


Decida mediante una prueba de hipótesis si existe dependencia entre las calificaciones obtenidas en 
el examen de admisión y las del tercer año. 


Suponiendo que se le proporcionaran los 130 pares de valores, y tomando en cuenta la escala de 
medición, ¿qué otra técnica de inferencia podría ser adecuada? ¿Cuáles serían las ventajas y desventajas 
de esa técnica comparada con la usada en este ejercicio? 


13.32. En un estudio de 511 familias con alta incidencia de trastornos mentales se clasificó a cada uno 
de sus miembros en una de tres clases mutuamente excluyentes: normales, retrasados mentales y 
locos. En seguida se presentan los resultados en una tabla de doble entrada, donde el otro criterio 
de clasificación es el sexo de cada individuo. Decida mediante una prueba de hipótesis (nivel de 
significancia del 1 %) si los dos criterios de clasificación son independientes (Fuente: Adaptado de 
Science, Vol. XIV, núm. 351, pág. 448, 1900). 


Normales Retrasados Mentales Locos 
Mujeres 266 717 33 
Hombres 311 532 21 


13.33. En un artículo publicado en The skeptical inquirer (otoño de 1978) se examinan las relaciones 
entre el signo del zodiaco y diversas variables supuestamente dependientes del signo zodiacal, en una 


Capítulo 13 
ALGUNAS TÉCNICAS NO PARAMÉTRICAS 


muestra de 946 personas. En la siguiente tabla se adaptan datos de dicho artículo, cruzando el signo 


con el cociente de inteligencia. En el artículo citado el cociente de inteligencia se reporta en sólo dos 
clases. Sería preferible usar la mediana en vez del promedio para generarlos. 


Cociente de inteligencia 


signo Arriba del promedio Promedio o menor 
Aries 39 31 
Tauro 28 37 
Géminis 39 38 
Cáncer 38 42 
Leo 44 43 
Virgo 44 45 
Libra 37 39 
Escorpión 41 36 
Sagitario 35 44 
Capricornio 43 45 
Acuario 37 39 
Piscis 42 40 


Decida si la inteligencia depende del signo de acuerdo con estos datos. 


13.34. En el mismo artículo reportado en el ejercicio 13.33 se midió también la capacidad de liderazgo de 
las 946 personas entrevistadas. En seguida se presenta una tabla de doble entrada para signo zodiacal 
y capacidad de liderazgo; esta última variable medida en la siguiente escala: 


1: Mucha. 

2: Promedio. 

3: Debajo del promedio. 

Capacidad de Signo 
liderazgo : i. i. s Se G Ac. Pi. 

1 24 12 10 20 16 17 20 14 16 15 
2 27 35 46 38 44 45 30 40 38 44 40 26 
3 19 18 21 22 27 27 26 23 25 29 24 35 


¿Muestran estos datos evidencias de que la capacidad de liderazgo depende del signo zodiacal? 


13.35. En un experimento (Science, Vol. 95, núm. 2453, pág.3, 2 de enero de 1942) se registró la reacción 
de un grupo de personas al olor del cuminol (un aceite esencial extraído del comino). Los resultados 
se presentan en las dos tablas siguientes. Los totales de hilera son fijos, ya que el número de hombres 
y mujeres en cada una de las pruebas estaba fijo de antemano. Por tanto la hipótesis que puede 
hacerse es de homogeneidad de poblaciones. 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Primera prueba 
Cuminol diluido (0.33% en Caolín) 


Reacción 
iji No lo detectaron Agradable Indiferente Desagradable 
Masculino 7 37 55 17 
Femenino E 24 56 23 
Segunda prueba 
Cuminol concentrado (3.3% en Caolín) 
> Reacción 
No lo detectaron Agradable Indiferente Desagradable 
Masculino 4 33 49 51 
Femenino 5] 10 29 60 


a) Para la primera prueba decida si hay diferencia entre sexos por lo que toca a su percepción del 
cuminol. 


b) Repita el inciso 4) para la segunda prueba. Compare sus resultados e interprételos. 
13.36. Los resultados del ejercicio 13.35 sugieren diferentes reacciones de los sexos a las concentraciones alta 
y baja. 


a) Forme una tabla de reacciones a las dos concentraciones para el sexo masculino. Pruebe igualdad 
de tratamientos (concentraciones). 


b) Repita el inciso a) para el sexo femenino. 


c) Compare sus resultados en a) y b) y concluya. ¿Confirman estas pruebas sus conclusiones en el 
ejercicio 13.35? 


MÉTODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. Probabilidades acumuladas de la distribución binomial* 


E 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 
—_ 2z2=z= _---=--=-=- 0 EQ A E A A 228909090 A AYUDAS 
n=1 0 0.9500 0.9000 0.8500 0.8000 0.7500 0.7000 0.6500 0.6000 0.5500 0.5000 
l 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 
1 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500 
2 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250 
l 0.9928 0.9720 0.9393 0.8960 0.8438 0.7840 0.7182 0.6480 0.5748 0.5000 
2 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750 
3 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625 
1 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 0.5630 0.4752 0.3910 0.3125 
2 0.9995 0.9963 0.9880 0.9728 0.9492 0.9163 0.8735 0.8208 0.7585 0.6875 
3 1.0000 0.9999 0.9995 0.9984 0.9961 0.9919 0.9850 0.9744 0.9590 0.9375 
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313 
1 0.9774 0.9185 0.8352 0.7373 0.6328 0,5282 0.4284 0.3370 0.2562 0.1875 
2 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 0.6826 0.5931 0.5000 
3 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.8125 
4 1.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0.9898 0.9815 0.9687 
5 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156 
1 0.9672 0.8857 0.7765 0.6554 0.5339 0,4202 0.3191 0.2333 0.1636 0.1094 
2 0.9978 0.9841 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.3438 
3 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.6563 
4 1.0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.8906 
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9982 0.9959 0.9917 0.9844 
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078 
1 0.9556 0.8503 0.7166 0.5767 0.4449 0,3294 0.2338 0.1586 0.1024 0.0625 
2 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 0.5323 0.4199 0.3164 0.2266 
3 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.5000 
A 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0.9444 0.9037 0.8471 0.7734 
5 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.9375 
6 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9984 0.9963 0.9922 
fi 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039 
1 0.9428 0.8131 0.6572 0.5033 0.3671 0.2553 0.1691 0.1064 0.0632 0.0352 
2 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 0.1445 
3 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5941 0.4770 0.3633 
4 1.0000 0.9996 0.9971 0.9896 0.9727 0.9420 0.8939 0.8263 0.7396 0.6367 
5 1.0000 1.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.8555 
6 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0.9915 0.9819 0.9648 
7 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961 
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


c 


n 
*SiX- Bin(n, p), la tabla da valores P(X <c),c=0,1,....1, P(X <c)= Sl) =A) 
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0.4500 
1.0000 


0.2025 
0.6975 
1.0000 


0.0911 
0.4252 
0.8336 
1.0000 


0.0410 
0.2415 
0.6090 
0.9085 
1.0000 


0.0185 
0.1312 
0.4069 
0.7438 
0.9497 
1.0000 


0.0083 
0.0692 
0.2553 
0.5585 
0.8364 
0.9723 
1.0000 


0.0037 
0.0357 
0.1529 
0.3917 
0.6836 
0.8976 
0.9848 
1.0000 


0.0017 
0.0181 
0.0885 
0.2604 
0.5230 
0.7799 
0.9368 
0.9916 
1.0000 


0.60 


0.4000 
1.0000 


0.1600 
0.6400 
1.0000 


0.0640 
0.3520 
0.7840 
1.0000 


0.0256 
0.1792 
0.5248 
0.8704 
1.0000 


0.0102 
0.0870 
0.3174 
0.6630 
0.9222 
1.0000 


0.0041 
0.0410 
0.1792 
0.4557 
0.7667 
0.9533 
1.0000 


0.0016 
0.0188 
0.0963 
0.2898 
0.5801 
0.8414 
0.9720 
1.0000 


0.0007 
0.0085 
0.0498 
0.1737 
0.4059 
0.6846 
0.8936 
0.9832 
1.0000 


0.65 


0.3500 
1.0000 


0.1225 
0:3775 
1.0000 


0.0429 
0.2818 
0.7254 
1.0000 


0.0150 
0.1265 
0.4370 
0.8215 
1.0000 


0.0053 
0.0540 
0.2352 
0.5716 
0.8840 
1.0000 


0.0018 
0.0223 
0.1174 
0.3529 
0.6809 
0.9246 
1.0000 


0.0006 
0.0090 
0.0556 
0.1998 
0.4677 
0.7662 
0.9510 
1.0000 


0.0002 
0.0036 
0.0253 
0.1061 
0.2936 
0.5722 
0.8309 
0.9681 
1.0000 


0.70 


0.3000 
1.0000 


0.0900 
0.5100 
1.0000 


0.0270 
0.2160 
0.6570 
1.0000 


0.0081 
0.0837 
0.3483 
0.7599 
1.0000 


0.0024 
0.0308 
0.1631 
0.4718 
0.8319 
1.0000 


0.0007 
0.0109 
0.0705 
0.2557 
0.5798 
0.8824 
1.0000 


0.0002 
0.0038 
0.0288 
0.1260 
0.3529 
0.6706 
0.9176 
1.0000 


0.0001 
0.0013 
0.0113 
0.0580 
0.1941 
0.4482 
0.7447 
0.9424 
1.0000 


P 
0.75 


0.2500 
1.0000 


0.0625 
0.4375 
1.0000 


0.0156 
0.1562 
0.5781 
1.0000 


0.0039 
0.0508 
0.2617 
0.6836 
1.0000 


0.0010 
0.0156 
0.1035 
0.3672 
0.7627 
1.0000 


0.0002 
0.0046 
0.0376 
0.1694 
0.4661 
0.8220 
1.0000 


0.0001 
0.0013 
0.0129 
0.0706 
0.2436 
0.5551 
0.8665 
1.0000 


0.0000 
0.0004 
0.0042 
0.0273 
0.1138 
0.3215 
0.6329 
0.8999 
1.0000 


0.80 


0.2000 
1.0000 


0.0400 
0.3600 
1.0000 


0.0080 
0.1040 
0.4880 
1.0000 


0.0016 
0.0272 
0.1808 
0.5904 
1.0000 


0.0003 
0.0067 
0.0579 
0.2627 
0.6723 
1.0000 


0.0001 
0.0016 
0.0170 
0.0989 
0.3446 
0.7379 
1.0000 


0.0000 
0.0004 
0.0047 
0.0333 
0.1480 
0.4233 
0.7903 
1.0000 


0.0000 
0.0001 
0.0012 
0.0104 
0.0563 
0.2031 
0.4967 
0.8322 
1.0000 


0.85 


0.1500 
1.0000 


0.0225 
0.2775 
1.0000 


0.0034 
0.0607 
0.3859 
1.0000 


0.0005 
0.0120 
0.1095 
0.4780 
1.0000 


0.0001 
0.0022 
0.0266 
0.1648 
0.5563 
1.0000 


0.0000 
0.0004 
0.0059 
0.0473 
0.2235 
0.6229 
1.0000 


0.0000 
0.0001 
0.0012 


* 0.0121 


0.0738 
0.2834 
0.6794 
1.0000 


0.0000 
0.0000 
0.0002 
0.0029 
0.0214 
0.1052 
0.3428 
0.7275 
1.0000 


0.90 


0.1000 
1.0000 


0.0100 
0.1900 
1.0000 


0.0010 
0.0280 
0.2710 
1.0000 


0.0001 
0.0037 
0.0523 
0.3439 
1.0000 


0.0000 
0.0005 
0.0086 
0.0815 
0.4095 
1.0000 


0.0000 
0.0001 
0.0013 
0.0158 
0.1143 
0.4686 
1.0000 


0.0000 
0.0000 
0.0002 
0.0027 
0.0257 
0.1497 
0.5217 
1.0000 


0.0000 
0.0000 
0.0000 
0.0004 
0.0050 
0.0381 
0.1869 
0.5695 
1.0000 


0.95 


0.0500 
1.0000 


0.0025 
0.0975 
1.0000 


0.0001 
0.0073 
0.1426 
1.0000 


0.0000 
0.0005 
0.0140 
0.1855 
1.0000 


0.0000 
0.0000 
0.0012 
0.0226 
0.2262 
1.0000 


0.0000 
0.0000 
0.0001 
0.0022 
0.0328 
0.2649 
1.0000 


0.0000 
0.0000 
0.0000 
0.0002 
0.0038 
0.0444 
0.3017 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0004 
0.0058 
0.0572 
0.3366 
1.0000 


TABLAS 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación) 


P 

E 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 
n=9 0 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020 
l 0.9288 0.7748 0.5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.0195 
2 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.0898 
3 0.9994 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.2539 
4 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.5000 
5 1.0000 0.9999 0.9994 0.9969 0.9900 0.9747 0.9464 0.9006 0.8342 0.7461 
6 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.9102 
7 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.9805 
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980 
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=10 0 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010 
1 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.0860 0.0464 0.0233 0.0107 
2 0.9885 0.9298 0.8202 0.6778 0.5256 0.3828 0.2616 0.1673 0.0996 0.0547 
3 0.9990 0.9872 0.9500 0.8791 0.7759 0.6496 0.5138 0.3823 0.2660 0.1719 
4 0.999 0.9984 0.9901 0.9672 0.9219 0.8497 0.7515 0.6331 0.5044 0.3770 
5 1.0000 0.9999 0.9986 0.9936 0.9803 0.9527 0.9051 0.8338 0.7384 0.6230 
6 1.0000 1.0000 0.9999 0.9991 0.9965 0.9894 0.9740 0.9452 0.8980 0.8281 
7 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9952 0.9877 0.9726 0.9453 
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9955 0.9893 
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=11 0 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.0005 
1 0.8981 0.6974 0.4922 0.3221 0.1971 0.1130 0.0606 0.0302 0.0139 0.0059 
2 0.9848 0.9104 0.7788 0.6174 0.4552 0.3127 0.2001 0.1189 0.0652 0.0327 
3 0.9984 0.9815 0.9306 0.8389 0.7133 0.5696 0.4256 0.2963 0.1911 0.1133 
4 0.9999 0.9972 0.9841 0.9496 0.8854 0.7897 0.6683 0.5328 0.3971 0.2744 
5 1.0000 0.9997 0.9973 0.9883 0.9657 0.9218 0.8513 0.7535 0.6331 0.5000 
6 1.0000 1.0000 0.9997 0.9980 0.9924 0.9784 0.9499 0.9006 0.8262 0.7256 
7 1.0000 1.0000 1.0000 0.9998 0.9988 0.9957 0.9878 0.9707 0.9390 0.8867 
8 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9980 0.9941 0.9852 0.9673 
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9978 0.9941 
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9995 
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=12 0 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.0002 
1 0.8816 0.6590 0.4435 0.2749 0.1584 0.0850 0.0424 0.0196 0.0083 0.0032 
2 0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.0193 
3 0.9978 0.9744 0.9078 0.7946 0.6488 0.4925 0.3467 0.2253 0.1345 0.0730 
4 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4382 0.3044 0.1938 
5 1.0000 0.9995 0.9954 0.9806 0.9456 0.8822 0.7873 0.6652 0.5269 0.3872 
6 1.0000 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 0.6128 
7 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.8062 
8 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.9270 
9 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.9807 
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9968 
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=13 0.5133 0.2542 0.1209 0.0550 0.0238 0.0097 0.0037 0.0013 0.0004 0.0001 


0.8646 0.6213 0.3983 0.2336 0.1267 0.0637 0.0296 0.0126 0.0049 0.0017 
} 0.0579 0.0269 0.0112 
0.9969 0.9658 0.8820 0.7473 0.5843 0.4206 0.2783 0.1686 0.0929 0.0461 
0.9997 0.9935 0.9658 0.9009 0.7940 0.6543 0.5005 0.3530 0.2279 0.1334 
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Merobos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación) 


0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 


a 


n=13 5 1.0000 0.9991 0.9925 0.9700 0.9198 0.8346 0.7159 0.5744 0.4268 0.2905 
6 1.0000 0.9999 0.9987 0.9930 0.9757 0.9376 0.8705 0.7712 0.6437 0.5000 
7 1.0000 1.0000 0.9998 0.9988 0.9944 0.9818 0.9538 0.9023 0.8212 0.7095 
8 1.0000 1.0000 1.0000 0.9998 0.9990 0.9960 0.9874 0.9679 0.9302 0.8666 
9 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9975 0.9922 0.9797 0.9539 
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9987 0.9959 0.9888 
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 


13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


O 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001 
1 0.8470 0.5846 0.3567 0.1979 0.1010 0.0475 0.0205 0.0081 0.0029 0.0009 
2 0.9699 0.8416 0.6479 0.4481 0.2811 0.1608 0.0839 0.0398 0.0170 0.0065 
3 0.9958 0.9559 0.8535 0.6982 0.5213 0.3552 0.2205 0.1243 0.0632 0.0287 
4 0.9996 0.9908 0.9533 0.8702 0.7415 0.5842 0.4227 0.2793 0.1672 0.0898 
5 1.0000 0.9985 0.9885 0.9561 0,8883 0.7805 0.6405 0.4859 0.3373 0.2120 
6 1.0000 0.9998 0.9978 0.9884 0.9617 0.9067 0.8164 0.6925 0.5461 0.3953 
7 1.0000 1.0000 0.9997 0.9976 0.9897 0.9685 0.9247 0.8499 0.7414 0.6047 
8 1.0000 1.0000 1.0000 0.9996 0.9978 0.9917 0.9757 0.9417 0.8811 0.7880 
1.0000 1.0000 1.0000 1.0000 0.9997 0.9983 0.9940 0.9825 0.9574 0.9102 
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9989 0.9961 0.9886 0.9713 
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9978 0.9935 
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


o] 


0 0,4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000 
1 0.8290 0.5490 0.3186 0.1671 0.0802 0.0353 0.0142 0.0052 0.0017 0.0005 
2 0.9638 0.8159 0.6042 0.3980 0.2361 0.1268 0.0617 0.0271 0.0107 0.0037 
3 0.9945 0.9444 0.8227 0.6482 0.4613 0.2969 0.1727 0.0905 0.0424 0.0176 
4 0.9994 0.9873 0.9383 0.8358 0.6865 0.5155 0.3519 0.2173 0.1204 0.0592 
5 0.999 0.9978 0.9832 0.9389 0.8516 0.7216 0.5643 0.4032 0.2608 0.1509 
6 1.0000 0.9997 0.9964 0.9819 0.9434 0.8689 0.7548 0.6098 0.4522 0.3036 
7 1.0000 1.0000 0.9994 0.9958 0.9827 0.9500 0.8868 0.7869 0.6535 0.5000 
8 1.0000 1.0000 0.9999 0.9992 0.9958 0.9848 0.9578 0.9050 0.8182 0.6964 
9 1.0000 1.0000 1.0000 0.9999 0.9992 0.9963 0.9876 0.9662 0.9231 0.8491 
10 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9972 0.9907 0.9745 0.9408 
11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9981 0.9937 0.9824 
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9963 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


— 
vi 


0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000 
0.8108 0.5147 0.2839 0.1407 0.0635 0.0261 0.0098 0.0033 0.0010 0.0003 
0.9571 0.7892 0.5614 0.3518 0.1971 0.0994 0.0451 0.0183 0.0066 0.0021 
0.9930 0.9316 0.7899 0.5981 0.4050 0.2459 0.1339 0.0651 0.0281 0.0106 
0.9991 0.9830 0.9209 0.7982 0.6302 0.4499 0.2892 0.1666 0.0853 0.0384 
0.9999 0.9967 0.9765 0.9183 0.8103 0.6598 0.4900 0.3288 0.1976 0.1051 
1.0000 0.9995 0.9944 0.9733 0.9204 0.8247 0.6881 0.5272 0.3660 0.2272 
1.0000 0.9999 0.9989 0.9930 0.9729 0.9256 0.8406 0.7161 0.5629 0.4018 
1.0000 1.0000 0.9998 0.9985 0.9925 0.9743 0.9329 0.8577 0.7441 0.5982 
1.0000 1.0000 1.0000 0.9998 0.9984 0.9929 0.9771 0.9417 0.8759 0.7728 
1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9938 0.9809 0.9514 0.8949 
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0.1788 0.0977 0.0462 0.0182 0.0056 0.0012 0.0002 0.0000 0.0000 
0.3563 0.2288 0.1295 0.0624 0.0243 0.0070 0.0013 0.0001 0.0000 
0.5732 0.4256 0.2841 0.1654 0.0802 0.0300 0.0075 0.0009 0.0000 
0.7721 0.6470 0.4995 0.3457 0.2060 0.0991 0.0342 0.0065 0.0003 
0.9071 0.8314 0.7217 0.5794 0.4157 0.2527 0.1180 0.0342 0.0031 
0.9731 0.9421 0.8868 0.7975 0.6674 0.4983 0.3080 0.1339 0.0245 
0.9951 0.9874 0.9704 0.9363 0.8733 0.7664 0.6017 0.3787 0.1354 
0.9996 0.9987 0.9963 0.9903 0.9762 0.9450 0.8791 0.7458 0.4867 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0022 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0114 0.0039 0.0011 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0426 0.0175 0.0060 0.0017 0.0003 0.0000 0.0000 0.0000 0.0000 
0.1189 0.0583 0.0243 0.0083 0.0022 0.0004 0.0000 0.0000 0.0000 
0.2586 0.1501 0.0753 0.0315 0.0103 0.0024 0.0003 0.0000 0.0000 
0.4539 0.3075 0.1836 0.0933 0.0383 0.0116 0.0022 0.0002 0.0000 
0.6627 0.5141 0.3595 0.2195 0.1117 0.0439 0.0115 0.0015 0.0000 
0.8328 0.7207 0.5773 0.4158 0.2585 0.1298 0.0467 0.0092 0.0004 
0.9368 0.8757 0.7795 0.6448 0.4787 0.3018 0.1465 0.0441 0.0042 
0.9830 0.9602 0.9161 0.8392 0.7189 0.5519 0.3521 0.1584 0.0301 
0.9971 0.9919 0.9795 0.9525 0.8990 0.8021 0.6433 0.4154 0.1530 
0.9998 0.9992 0.9976 0.9932 0.9822 0.9560 0.8972 0.7712 0.5123 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0011 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0063 0.0019 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0255 0.0093 0.0028 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 
0.0769 0.0338 0.0124 0.0037 0.0008 0.0001 0.0000 0.0000 0.0000 
0.1818 0.0950 0.0422 0.0152 0.0042 0.0008 0.0001 0.0000 0.0000 
0.3465 0.2131 0.1132 0.0500 0.0173 0.0042 0.0006 0.0000 0.0000 
0.5478 0.3902 0.2452 0.1311 0.0566 0.0181 0.0036 0.0003 0.0000 
0.7392 0.5968 0.4357 0.2784 0.1484 0.0611 0.0168 0.0022 0.0001 
0.8796 0.7827 0.6481 0.4845 0.3135 0.1642 0.0617 0.0127 0.0006 
0.9576 0.9095 0.8273 0.7031 0.5387 0.3518 0.1773 0.0556 0.0055 
0.9893 0.9729 0.9383 0.8732 0.7639 0.6020 0.3958 0.1841 0.0362 
0.9983 0.9948 0.9858 0.9647 0.9198 0.8329 0.6814 0.4510 0.1710 
0.9999 0.9995 0.9984 0.9953 0.9866 0.9648 0.9126 0.7941 0.5367 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0035 0.0009 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0149 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 
0.0486 0.0191 0.0062 0.0016 0.0003 0.0000 0.0000 0.0000 0.0000 
0.1241 0.0583 0.0229 0.0071 0.0016 0.0002 0.0000 0.0000 0.0000 
0.2559 0.1423 0.0671 0.0257 0.0075 0.0015 0.0002 0.0000 0.0000 
0.4371 0.2839 0.1594 0.0744 0.0271 0.0070 0.0011 0.0001 0.0000 
0.6340 0.4728 0.3119 0.1753 0.0796 0.0267 0.0056 0.0005 0.0000 
0.8024 0.6712 0.5100 0.3402 0.1897 0.0817 0.0235 0.0033 0.0001 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación) 


P 

c 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 
n=16 11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9991 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=17 0 0.4181 0.1668 0.0631 0.0225 0.0075 0.0023 0.0007 0.0002 
1 0.7922 0.4818 0.2525 0.1182 0.0501 0.0193 0.0067 0.0021 
2 0.9497 0.7618 0.5198 0.3096 0.1637 0.0774 0.0327 0.0123 
3 0.9912 0.9174 0.7556 0.5489 0.3530 0.2019 0.1028 0.0464 
4 0.9988 0.9779 0.9013 0.7582 0.5739 0.3887 0.2348 0.1260 
5 0.9999 0.9953 0.9681 0.8943 0.7653 0.5968 0.4197 0.2639 
6 1.0000 0.9992 0.9917 0.9623 0.8929 0.7752 0.6188 0.4478 
Z 1.0000 0.9999 0.9983 0.9891 0.9598 0.8954 0.7872 0.6405 
8 1.0000 1.0000 0.9997 0.9974 0.9876 0.9597 0.9006 0.8011 
3 1.0000 1.0000 1.0000 0.9995 0.9969 0.9873 0.9617 0.9081 
10 1.0000 1.0000 1.0000 0.9999 0.9994 0.9968 0.9880 0.9652 
11 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9970 0.9894 
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9975 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=18 0 0.3972 0.1501 0.0536 0.0180 0.0056 0.0016 0.0004 0.0001 
1 0.7735 0.4503 0.2241 0.0991 0.0395 0.0142 0.0046 0.0013 
2 0.9419 0.7338 0.4797 0.2713 0.1353 0.0600 0.0236 0.0082 
3 0.9891 0.9018 0.7202 0.5010 0.3057 0.1646 0.0783 0.0328 
4 0.9985 0.9718 0.8794 0.7164 0.5187 0.3327 0.1886 0.0942 
5 0.9998 0.9936 0.9581 0.8671 0.7175 0.5344 0.3550 0.2088 
6 1.0000 0.9988 0.9882 0.9487 0.8610 0.7217 0.5491 0.3743 
7 1.0000 0.9998 0.9973 0.9837 0.9431 0.8593 0.7283 0.5634 
8 1.0000 1.0000 0.9995 0.9957 0.9807 0.9404 0.8609 0.7368 
9 1.0000 1.0000 0.9999 0.9991 0.9946 0.9790 0.9403 0.8653 
10 1.0000 1.0000 1.0000 0.9998 0.9988 0.9939 0.9788 0.9424 
11 1.0000 1.0000 1.0000 1.0000 0.9998 0.9986 0.9938 0.9797 
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9986 0.9942 
13 — 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
16 1.0000 1.0000 1.0000 1.0000. 1.0000 1.0000 1.0000 1.0000 
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=19 0 0.3774 0.1351 0.0456 0.0144 0.0042 0.0011 0.0003 0.0001 
1 0.7547 0.4203 0.1985 0.0829 0.0310 0.0104 0.0031 0.0008 
2 0.9335 0.7054 0.4413 0.2369 0.1113 0.0462 0.0170 0.0055 
3 0.9868 0.8850 0.6841 0.4551 0.2631 0.1332 0.0591 0.0230 
4 0.9980 0.9648 0.8556 0.6733 0.4654 0.2822 0.1500 0.0696 
5 0.9998 0.9914 0.9463 0.8369 0.6678 0.4739 0.2968 0.1629 
6 1.0000 0.9983 0.9837 0.9324 0.8251 0.6655 0,4812 0.3081 
7 1.0000 0.9997 0.9959 0.9767 0.9225 0.8180 0.6656 0.4878 


Pi 
€ 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 

n=16 11 0.9147 0.8334 0.7108 0.5501 0.3698 0.2018 0.0791 0.0170 0.0009 
12 0.9719 0.9349 0.8661 0.7541 0.5950 0.4019 0.2101 0.0684 0.0070 
13 0.9934 0.9817 0.9549 0.9006 0.8029 0.6482 0.4386 0.2108 0.0429 
14 0.9990 0.9967 0.9902 0.9739 0.9365 0.8593 0.7161 0.4853 0.1892 
15 0.9999 0.9997 0.9990 0.9967 0.9900 0.9719 0.9257 0.8147 0.5599 
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=17 0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0003 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0019 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
4 0.0086 0.0025 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 
5 0.0301 0.0106 0.0030 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 
6 0.0826 0.0348 0.0120 0.0032 0.0006 0.0001 0.0000 0.0000 0.0000 
7 0.1834 0.0919 0.0383 0.0127 0.0031 0.0005 0.0000 0.0000 0.0000 
8 0.3374 0.1989 0.0994 0.0403 0.0124 0.0026 0.0003 0.0000 0.0000 
9 0.5257 0.3595 0.2128 0.1046 0.0402 0.0109 0.0017 0.0001 0.0000 
10 0.7098 0.5522 0.3812 0.2248 0.1071 0.0377 0.0083 0.0008 0.0000 
11 0.8529 0.7361 0.5803 0.4032 0.2347 0.1057 0.0319 0.0047 0.0001 
12 0.9404 0.8740 0.7652 0.6113 0.4261 0.2418 0.0987 0.0221 0.0012 
13 0.9816 0.9536 0.8972 0.7981 0.6470 0.4511 0.2444 0.0826 0.0088 
14 0.9959 0.9877 0.9673 0.9226 0.8363 0.6904 0.4802 0.2382 0.0503 
15 0.9994 0.9979 0.9933 0.9807 0.9499 0.8818 0.7475 0.5182 0.2078 
16 1.0000 0.9998 0.9993 0.9977 0.9925 0.9775 0.9369 0.8332 0.5819 
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=18 0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0010 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
á 0.0049 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
5 0.0183 0.0058 0.0014 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 
6 0.0537 0.0203 0.0062 0.0014 0.0002 0.0000 0.0000 0.0000 0.0000 
7 0.1280 0.0576 0.0212 0.0061 0.0012 0.0002 0.0000 0.0000 0.0000 
8 0.2527 0.1347 0.0597 0.0210 0.0054 0.0009 0.0001 0.0000 0.0000 
9 0.4222 0.2632 0.1391 0.0596 0.0193 0.0043 0.0005 0.0000 0.0000 
10 0.6085 0.4366 0.2717 0.1407 0.0569 0.0163 0.0027 0.0002 0.0000 
11 0.7742 0.6257 0.4509 0.2783 0.1390 0.0513 0.0118 0.0012 0.0000 
12 0.8923 0.7912 0.6450 0.4656 0.2825 0.1329 0.0419 0.0064 0.0002 
13 0.9589 0.9058 0.8114 0.6673 0.4813 0.2836 0.1206 0.0282 0.0015 
14 0.9880 0.9672 0.9217 0.8354 0.6943 0.4990 0.2798 0.0982 0.0109 
15 0.9975 0.9918 0.9764 0.9400 0.8647 0.7287 0.5203 0.2662 0.0581 
16 0.9997 0.9987 0.9954 0.9858 0.9605 0.9009 0.7759 0.5497 0.2265 
17 1.0000 0.9999 0.9996 0.9984 0.9944 0.9820 0.9464 0.8499 0.6028 
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=19 0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
4 0.0028 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
5 0.0109 0.0031 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 
6 0.0342 0.0116 0.0031 0.0006 0.0001 0.0000 0.0000 0.0000 0.0000 
7 0.0871 0.0352 0.0114 0.0028 0.0005 0.0000 0.0000 0.0000 0.0000 


TABLAS 


METODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación). 


n=20 0 0.3585 0.1216 
1 0.7358 0.3917 
2 0.9245 0.6769 
3 0.9841 0.8670 
4 0.9974 0.9568 
5 0.9997 0.9887 
6 1.0000 0.9976 
7 1.0000 0.9996 
8 1.0000 0.9999 
9 1.0000 1.0000 
10 1.0000 1.0000 
11 1.0000 1.0000 
12 1.0000 1.0000 
13 1.0000 1.0000 
14 1.0000 1.0000 
15 1.0000 1.0000 
16 1.0000 1.0000 
17 1.0000 1.0000 
18 1.0000 1.0000 
19 1.0000 1.0000 
20 1.0000 1.0000 

n=21 0.3406 0.1094 
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n= 20 


ks] 


0.55 


0.1841 
0.3290 
0.5060 
0.6831 
0.8273 
0.9223 
0.9720 
0.9923 
0.9985 
0.9998 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0003 
0.0015 
0.0064 
0.0214 
0.0580 
0.1308 
0.2493 
0.4086 
0.5857 
0.7480 
0.8701 
0.9447 
0.9811 
0.9951 
0.9991 
0.9999 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0001 
0.0008 
0.0037 
0.0132 
0.0379 
0.0908 
0.1841 
0.3210 
0.4883 
0.6587 
0.8029 
0.9036 
0.9611 
0.9874 
0.9969 
0.9994 


0.60 


0.0885 
0.1861 
0.3325 
0.5122 
0.6919 
0.8371 
0.9304 
0.9770 
0.9945 
0.9992 
0.9999 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0003 
0.0016 
0.0065 
0.0210 
0.0565 
0.1275 
0.2447 
0.4044 
0.5841 
0.7500 
0.8744 
0.9490 
0.9840 
0.9964 
0.9995 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0002 
0.0008 
0.0036 
0.0123 
0.0352 
0.0849 
0.1744 
0.3086 
0.4763 
0.6505 
0.7998 
0.9043 
0.9630 
0.9890 
0.9976 


0.65 


0.0347 
0.0875 
0.1855 
0.3344 
0.5188 
0.7032 
0.8500 
0.9409 
0.9830 
0.9969 
0.9997 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0003 
0.0015 
0.0060 
0.0196 
0.0532 
0.1218 
0.2376 
0.3990 
0.5834 
0.7546 
0.8818 
0.9556 
0.9879 
0.9979 
0.9998 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0007 
0.0031 
0.0108 
0.0313 
0.0772 
0.1623 
0.2941 
0.4635 
0.6433 
0.7991 
0.9076 
0.9669 
0.9914 


0.70 


0.0105 
0.0326 
0.0839 
0.1820 
0.3345 
0.5261 
0.7178 
0.8668 
0.9538 
0.9896 
0.9989 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0003 
0.0013 
0.0051 
0.0171 
0.0480 
0.1133 
0.2277 
0.3920 
0.5836 
0.7625 
0.8929 
0.9645 
0.9924 
0.9992 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0006 
0.0024 
0.0087 
0.0264 
0.0676 
0.1477 
0.2770 
0.4495 
0.6373 
0.8016 
0.9144 
0.9729 


P 
0.75 


0.0023 
0.0089 
0.0287 
0.0775 
0.1749 
0.3322 
0.5346 
0.7369 
0.8887 
0.9690 
0.9958 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0002 
0.0009 
0.0039 
0.0139 
0.0409 
0.1018 
0.2142 
0.3828 
0.5852 
0.7748 
0.9087 
0.9757 
0.9968 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0004 
0.0017 
0.0064 
0.0206 
0.0561 
0.1299 
0.2564 
0.4334 
0.6326 
0.8083 
0.9255 


0.80 


0.0003 
0.0016 
0.0067 
0.0233 
0.0676 
0.1631 
0.3267 
0.5449 
0.7631 
0.9171 
0.9856 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0006 
0.0026 
0.0100 
0.0321 
0.0867 
0.1958 
0.3704 
0.5886 
0.7939 
0.9308 
0.9885 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0002 
0.0010 
0.0041 
0.0144 
0.0431 
0.1085 
0.2307 
0.4140 
0.6296 
0.8213 


0.85 


0.0000 
0.0001 
0.0008 
0.0041 
0.0163 
0.0537 
0.1444 
0.3159 
0.5587 
0.8015 
0.9544 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0002 
0.0013 
0.0059 
0.0219 
0.0673 
0.1702 
0.3523 
0.5951 
0.8244 
0.9612 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0004 
0.0020 
0.0083 
0.0287 
0.0827 
0.1975 
0.3887 
0.6295 


0.90 


0.0000 
0.0000 
0.0000 
0.0003 
0.0017 
0.0086 
0.0352 
0.1150 
0.2946 
0.5797 
0.8649 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0004 
0.0024 
0.0113 
0.0432 
0.1330 
0.3231 
0.6083 
0.8784 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0000 
0.0001 
0.0006 
0.0033 
0.0144 
0.0522 
0.1520 
0.3516 


TABLAS 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación) 


c 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 


n=21 19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.3235 0.0985 0.0280 0.0074 0.0018 0.0004 0.0001 0.0000 0.0000 0.0000 
0.6982 0.3392 0.1367 0.0480 0.0149 0.0041 0.0010 0.0002 0.0000 0.0000 
0.9052 0.6200 0.3382 0.1545 0.0606 0.0207 0.0061 0.0016 0.0003 0.0001 
0.9778 0.8281 0.5752 0.3320 0.1624 0.0681 0.0245 0.0076 0.0020 0.0004 
0.9960 0.9379 0.7738 0.5429 0.3235 0.1645 0.0716 0.0266 0.0083 0.0022 
0.9994 0.9818 0.9001 0.7326 0.5168 0.3134 0.1629 0.0722 0.0271 0.0085 
0.9999 0.9956 0.9632 0.8670 0.6994 0.4942 0.3022 0.1584 0.0705 0.0262 
1.0000 0.9991 0.9886 0.9439 0.8385 0.6713 0.4736 0.2898 0.1518 0.0669 
1.0000 0.9999 0.9970 0.9799 0.9254 0.8135 0.6466 0.4540 0.2764 0.1431 
1.0000 1.0000 0.9993 0.9939 0.9705 0.9084 0.7916 0.6244 0.4350 0.2617 
1.0000 1.0000 0.9999 0.9984 0.9900 0.9613 0.8930 0.7720 0.6037 0.4159 
1.0000 1.0000 0.9997 0.9971 0.9860 0.9526 0.8793 0.7543 0.5841 
1.0000 1.0000 1.0000 0.9999 0.9993 0.9957 0.9820 0.9449 0.8672 0.7383 
1.0000 1.0000 1.0000 1.0000 0.9999 0.9989 0.9942 0.9785 0.9383 0.8569 
1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9984 0.9930 0.9757 0.9331 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9981 0.9920 0.9738 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9979 0.9915 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9978 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 


cE RE e r Ere a a MA DN O 
ps 
o 
=] 
© 
S 


20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
22 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.3074 0.0886 0.0238 0.0059 0.0013 0.0003 0.0000 0.0000 0.0000 0.0000 
0.6794 0.3151 0.1204 0.0398 0.0116 0.0030 0.0007 0.0001 0.0000 0.0000 
0.8948 0.5920 0.3080 0.1332 0.0492 0.0157 0.0043 0.0010 0.0002 0.0000 
0.9742 0.8073 0.5396 0.2965 0.1370 0.0538 0.0181 0.0052 0.0012 0.0002 
0.9951 0.9269 0.7440 0.5007 0.2832 0.1356 0.0551 0.0190 0.0055 0.0013 
0.9992 0.9774 0.8811 0.6947 0,4685 0.2688 0.1309 0.0540 0.0186 0.0053 
0.9999 0.9942 0.9537 0.8402 0.6537 0.4399 0.2534 0.1240 0.0510 0.0173 
1.0000 0.9988 0.9848 0.9285 0.8037 0.6181 0.4136 0.2373 0.1152 0.0466 
1.0000 0.9998 0.9958 0.9727 0.9037 0.7709 0.5860 0.3884 0.2203 0.1050 
1.0000 1.0000 0.9990 0.9911 0.9592 0.8799 0.7408 0.5562 0.3636 0.2024 
1.0000 1.0000 0.9998 0.9975 0.9851 0.9454 0.8575 0.7129 0.5278 0.3388 
1.0000 1.0000 0.9994 0.9954 0.9786 0.9318 0.8364 0.6865 0.5000 
1.0000 1.0000 1.0000 0.9999 0.9988 0.9928 0.9717 0.9187 0.8164 0.6612 
1.0000 1.0000 1.0000 1.0000 0.9997 0.9979 0.9900 0.9651 0.9063 0.7976 
1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9970 0.9872 0.9589 0.8950 
1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9992 0.9960 0.9847 0.9534 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9952 0.9827 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9988 0.9947 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9987 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 


CSAR RPESYV ONANAN = O 
k 
> 
S 
S 
S 


20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
22 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


N 
LeS] 
— 
o 
e 
o 
o 


o 
Oy UM bp UYNnN-ovOo Jou AUN= O 


Dd; paa q 
© V œ 


N N 
N m 


b d p p j p p p p j 
9100) Y Gi AD NA 20 O SNO e 00 O 


NNNN 
GU hn O 


0.9999 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0001 
0.0005 
0.0021 
0.0080 
0.0243 
0.0617 
0.1328 
0.2457 
0.3963 
0.5650 
0.7236 
0.8482 
0.9295 
0.9729 
0.9917 
0.9980 
0.9997 
1.0000 
1.0000 
1.0000 


0.0000 
0.0000 
0.0000 
0.0000 
0.0002 
0.0012 
0.0048 
0.0153 
0.0411 
0.0937 
0.1836 
0.3135 
0.4722 
0.6364 
0.7797 
0.8848 
0.9490 
0.9814 
0.9945 
0.9988 
0.9998 
1.0000 
1.0000 
1.0000 


TABLAS 


MeroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPUNARIO 
Infante-Gil y Zárate de Lara 


Tabla A. (Continuación) 


il a aa MENA Rs 
id 
> 
S 
S 
S 
i 
> 
z= 
S 
5 


1.0000 1.0000 
21 1.0000 1.0000 
22 1.0000 1.0000 
23 1.0000 1.0000 
24 1.0000 1.0000 


n=25 


SoN RUUN= O 
2 
Y 
© 
o0 
00 
$ 
2 
Q 
y 


1.0000 0.9977 
1.0000 0.9995 
1.0000 0.9999 
10 1.0000 1.0000 


P 
E 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 
n=24 0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
4 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
5 0.0007 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
6 0.0028 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
7 0.0095 0.0022 0.0004 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
8 0.0269 0.0075 0.0016 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 
9 0.0648 0.0217 0.0055 0.0010 0.0001 0.0000 0.0000 0.0000 0.0000 
10 0.1341 0.0535 0.0164 0.0036 0.0005 0.0000 0.0000 0.0000 0.0000 
11 0.2420 0.1143 0.0423 0.0115 0.0021 0.0002 0.0000 0.0000 0.0000 
12 0.3849 0.2130 0.0942 0.0314 0.0072 0.0010 0.0001 0.0000 0.0000 
13 0.5461 0.3498 0.1833 0.0742 0.0213 0.0038 0.0003 0.0000 0.0000 
14 0.7009 0.5109 0.3134 0.1528 0.0547 0.0126 0.0015 0.0001 0.0000 
15 0.8270 0.6721 0,4743 0.2750 0.1213 0.0362 0.0059 0.0003 0.0000 
16 0.9137 0.8081 0.6425 0.4353 0.2338 0.0892 0.0199 0.0017 0.0000 
17 0.9636 0.9040 0.7894 0.6114 0.3926 0.1889 0.0572 0.0075 0.0001 
18 0.9873 0.9600 0.8956 0.7712 0.5778 0,3441 0.1394 0.0277 0.0010 
19 0.9964 0.9866 0.9578 0.8889 0.7534 0.5401 0.2866 0.0851 0.0060 
20 0.9992 0.9965 0.9867 0.9576 0.8850 0.7361 0.4951 0.2143 0.0298 
21 0.9999 0.9993 0.9970 0.9881 0.9602 0.8855 0.7202 0.4357 0.1159 
22 1.0000 0.9999 0.9995 0.9978 0.9910 0.9669 0.8941 0.7075 0.3392 
23 1.0000 1.0000 1.0000 0.9998 0.9990 0.9953 0.9798 0.9202 0.7080 
24 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
n=25 0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
2 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
3 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
4 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
9 0.0004 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
6 0.0016 0.0003 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
7 0.0058 0.0012 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 
8 0.0174 0.0043 0.0008 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 
9 0.0440 0.0132 0.0029 0.0005 0.0000 0.0000 0.0000 0.0000 0.0000 
10 0.0960 0.0344 0.0093 0.0018 0.0002 0.0000 0.0000 0.0000 0.0000 
11 0.1827 0.0778 0.0255 0.0060 0.0009 0.0001 0.0000 0.0000 0.0000 
12 0.3063 0.1538 0.0604 0.0175 0.0034 0.0004 0.0000 0.0000 0.0000 
13 0.4574 0.2677 0.1254 0.0442 0.0107 0.0015 0.0001 0.0000 0.0000 
14 0.6157 0.4142 0.2288 0.0978 0.0297 0.0056 0.0005 0.0000 0.0000 
15 0.7576 0.5754 0.3697 0.1894 0.0713 0.0173 0.0021 0.0001 0.0000 
16 0.8660 0.7265 0.5332 0.3231 0,1494 0.0468 0.0080 0.0005 0.0000 
17 0.9361 0.8464 0.6939 0.4882 0.2735 0.1091 0.0255 0.0023 0.0000 
18 0.9742 0.9264 0.8266 0.6593 0.4389 0.2200 0.0695 0.0095 0.0002 
19 0.9914 0.9706 0.9174 0.8065 0.6217 0.3833 0.1615 0.0334 0.0012 
20 0.9977 0.9905 0.9680 0.9095 0.7863 0.5793 0.3179 0.0980 0.0072 
21 0.9995 0.9976 0.9903 0.9668 0.9038 0.7660 0.5289 0.2364 0.0341 
22 0.9999 0.9996 0.9979 0.9910 0.9679 0.9018 0.7463 0.4629 0.1271 
23 1.0000 0.9999 0.9997 0.9984 0.9930 0.9726 0.9069 0.7288 0.3576 
24 1.0000 1.0000 1.0000 0.9999 0.9992 0.9962 0.9828 0.9282 0.7226 
25 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


TABLAS 


MÉTODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 


Infante-Gil 


y Zárate de Lara 


Tabla B. Probabilidades acumuladas de la distribución de Poisson* 


c 1.0 L5 2.0 ZO 3.0 SA 4.0 4.5 5.0 5.5 
0 0.3679 0.2231 0.1353 0.0821 0.0498 0.0302 0.0183 0.0111 0.0067 0.0041 
1 0.7358 0.5578 0.4060 0.2873 0.1991 0.1359 0.0916 0.0611 0.0404 0.0266 
2 0.9197 0.8088 0.6767 0.5438 0.4232 0.3208 0.2381 0.1736 0.1247 0.0884 
3 0.9810 0.9344 0.8571 0.7576 0.6472 0.5366 0.4335 0.3423 0.2650 0.2017 
4 0.9963 0.9814 0.9473 0.8912 0.8153 0.7254 0.6288 0.5321 0.4405 0.3575 
5 0.9994 0.9955 0.9834 0.9580 0.9161 0.8576 0.7851 0.7029 0.6160 0.5289 
6 0.9999 0.9991 0.9955 0.9858 0.9665 0.9347 0.8893 0.8311 0.7622 0.6860 
7 1.0000 0.9998 0.9989 0.9958 0.9881 0.9733 0.9489 0.9134 0.8666 0.8095 
8 1.0000 1.0000 0.9998 0.9989 0.9962 0.9901 0.9786 0.9597 0.9319 0.8944 
9 1.0000 1.0000 1.0000 0.9997 0.9989 0.9967 0.9919 0.9829 0.9682 0.9462 
10 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9972 0.9933 0.9863 0.9747 
11 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991 0.9976 0.9945 0.9890 
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980 0.9955 
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9993 0.9983 
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
HO AA íÁ—Á __zmzéz _a AA Y 1000 10000 1.0000 


0 0.0000 
1 0.0002 
2 0.0012 
3 0.0049 
á 0.0151 
5 0.0375 
6 0.0786 
7 0.1432 
8 0.2320 
9 0.3405 
10 0.4599 
11 0.5793 
12 0.6887 
13 0.7813 
14 0.8540 
15 0.9074 
16 0.9441 
17 0.9678 
18 0.9823 
19 0.9907 


0.0000 
0.0001 
0.0008 
0.0034 
0.0107 
0.0277 
0.0603 
0.1137 
0.1906 
0.2888 
0,4017 
0.5198 
0.6329 
0.7330 
0.8153 
0.8783 
0.9236 
0.9542 
0.9738 
0.9857 


0.0000 
0.0001 
0.0005 
0.0023 
0.0076 
0.0203 
0.0458 
0.0895 
0.1550 
0.2424 
0.3472 
0.4616 
0.5760 
0.6815 
0.7720 
0.8444 
0.8987 
0.9370 
0.9626 
0.9787 


0.0000 
0.0001 
0.0003 
0.0016 
0.0053 
0.0148 
0.0346 
0.0698 
0.1249 
0.2014 
0.2971 
0.4058 
0.5190 
0.6278 
0.7250 
0.8060 
0.8693 
0.9158 
0.9481 
0.9694 


0.0000 
0.0000 
0.0002 
0.0011 
0.0037 
0.0107 
0.0259 
0.0540 
0.0998 
0.1658 
0.2517 
0.3532 
0.4631 
0.5730 
0.6751 
0.7636 
0.8355 
0.8905 
0.9302 
0.9573 


0.0000 
0.0000 
0.0001 
0.0005 
0.0018 
0.0055 
0.0142 
0.0316 
0.0621 
0.1094 
0.1757 
0.2600 
0.3585 
0.4644 
0.5704 
0.6694 
0.7559 
0.8272 
0.8826 
0.9235 


0.0000 
0.0000 
0.0001 
0.0003 
0.0012 
0.0039 
0.0105 
0.0239 
0.0484 
0.0878 
0.1449 
0.2201 
0.3111 
0.4125 
0.5176 
0.6192 
0.7112 
0.7897 
0.8530 
0.9012 


0.0000 
0.0000 
0.0000 
0.0002 
0.0009 
0.0028 
0.0076 
0.0180 
0.0374 
0.0699 
0.1185 
0.1848 
0.2676 
0.3632 
0.4657 
0.5681 
0.6641 
0.7489 
0.8195 
0.8752 


20 0.9953 0.9925 0.9884 0.9827 0.9750 0.9649 0.9521 0.9362 0.9170 0.8944 
— 2% E OOO LAS LO UL 0.9170 0.8944 


* Si X ~ P(A), la tabla da valores de P(X <c),c=0,1,....20. P(X<0c)= Y £ 


x=0 


Tabla B. (Continuación) 


ê 6.0 6.5 7.0 7:9 8.0 8.5 9.0 9.5 10.0 10.5 
0 0.0025 0.0015 0.0009 0.0006 0.0003 0.0002 0.0001 0.0001 0.0000 0.0000 
1 0.0174 0.0113 0.0073 0.0047 0.0030 0.0019 0.0012 0.0008 0.0005 0.0003 
2 0.0620 0.0430 0.0296 0.0203 0.0138 0.0093 0.0062 0.0042 0.0028 0.0018 
3 0.1512 0.1118 0.0818 0.0591 0.0424 0.0301 0.0212 0.0149 0.0103 0.0071 
4 0.2851 0.2237 0.1730 0.1321 0.0996 0.0744 0.0550 0.0403 0.0293 0.0211 
5 0.4457 0.3690 0.3007 0.2414 0.1912 0.1496 0.1157 0.0885 0.0671 0.0504 
6 0.6063 0.5265 0.4497 0.3782 0.3134 0.2562 0.2068 0.1649 0.1301 0.1016 
7 0.7440 0.6728 0.5987 0.5246 0.4530 0.3856 0.3239 0.2687 0,2202 0.1785 
8 0.8472 0.7916 0.7291 0.6620 0.5925 0.5231 0.4557 0.3918 0.3328 0.2794 
9 0.9161 0.8774 0.8305 0.7764 0.7166 0.6530 0.5874 0.5218 0.4579 0.3971 
10 0.9574 0.9332 0.9015 0.8622 0.8159 0.7634 0.7060 0.6453 0.5830 0.5207 
11 0.9799 0.9661 0.9467 0.9208 0.8881 0.8487 0.8030 0.7520 0.6968 0.6387 
12 0.9912 0.9840 0.9730 0.9573 0.9362 0.9091 0.8758 0.8364 0.7916 0.7420 
13 0.9964 0.9929 0.9872 0.9784 0.9658 0.9486 0.9261 0.8981 0.8645 0.8253 
14 0.9986 0.9970 0.9943 0.9897 0.9827 0.9726 0.9585 0.9400 0.9165 0.8879 
15 0.9995 0.9988 0.9976 0.9954 0.9918 0.9862 0.9780 0.9665 0.9513 0.9317 
16 0.9998 0.9996 0.9990 0.9980 0.9963 0.9934 0.9889 0.9823 0.9730 0.9604 
17 0.9999 0.9998 0.9996 0.9992 0.9984 0.9970 0.9947 0.9911 0.9857 0.9781 
18 1.0000 0.9999 0.9999 0.9997 0.9993 0.9987 0.9976 0.9957 0.9928 0.9885 

19 1.0000 1.0000 1.0000 0.9999 0.9997 0.9995 0.9989 0.9980 0.9965 0.9942 

20 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9996 0.9991 0.9984 0.9972 
c 16 16.5 17.0 17.5 18.0 18.5 19.0 19.5 20.0 

0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 

1 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 

2 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 

3 0.0001 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 

4 0.0004 0.0003 0.0002 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 

5 0.0014 0.0010 0.0007 0.0005 0.0003 0.0002 0.0002 0.0001 0.0001 

6 0.0040 0.0029 0.0021 0.0015 0.0010 0.0007 0.0005 0.0004 0.0003 

7 0.0100 0.0074 0.0054 0.0040 0.0029 0.0021 0.0015 0.0011 0.0008 

8 0.0220 0.0167 0.0126 0.0095 0.0071 0.0052 0.0039 0.0028 0.0021 

9 0.0433 0.0337 0.0261 0.0201 0.0154 0.0117 0.0089 0.0067 0.0050 

10 0.0774 0.0619 0.0491 0.0387 0.0304 0.0237 0.0183 0.0141 0.0108 

11 0.1270 0.1041 0.0847 0.0684 0.0549 0.0438 0.0347 0.0273 0.0214 

12 0.1931 0.1621 0,1350 0.1116 0.0917 0.0748 0.0606 0.0488 0.0390 

13 0.2745 0.2357 0.2009 0.1699 0.1426 0.1189 0.0984 0.0809 0.0661 

14 0.3675 0,3225 0.2808 0.2426 0.2081 0.1771 0.1497 0.1257 0.1049 

15 0.4667 0.4180 0.3715 0.3275 0.2867 0.2490 0.2148 0.1840 0.1565 

16 0.5660 0.5165 0,4677 0.4204 0.3751 0.3321 0.2920 0.2550 0.2211 

17 0.6593 0.6120 0.5640 0.5160 0.4686 0.4226 0.3784 0.3364 0.2970 

18 0.7423 0.6996 0.6550 0.6089 0.5622 0.5156 0.4695 0,4246 0.3814 

19 0.8122 0.7757 0.7363 0.6945 0.6509 0.6061 0.5606 0.5151 0.4703 

20 0.8682 0.8385 0.8055 0.7694 0.7307 0.6898 0.6472 0.6034 0.5591 


TABLAS 


METODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 


Infante-Gil y Zárate de Lara 


Tabla C. Probabilidades acumuladas de la distribución Normal Estándar 


z y 
La tabla da el área a la izquierda de un valor de Zo sea: f = “Pa 
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 

3H 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 
—3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002 
343 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003 
—3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005 
—3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007 
=30 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010 
—2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014 
=2Z8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019 
2 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026 
—2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036 
2D 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048 
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064 
=23 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 
—2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 
=2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 
—2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 
=1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233 
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 
=1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 
—1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 
—1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 
—1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681 
139 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 
12 OSI 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 
=-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 
0,9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611 
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 
=0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 
—0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 
—0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 
—0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 
—0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0,4404 0.4364 0.4325 0.4286 0.4247 
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641 


TABLAS 


Merobos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla D. Valores seleccionados de x¿(v) 
En la distribución Ji-Cuadrada con v grados de libertad la tabla proporciona el valor de %3(v) tal que P ( > yw) =q. 


0.001 0.005 0.010 0.025 


10.8276 7.8794 6.6349 5.0239 3.8415 0.0039 0.0010 0.0002 0.0000 0.0000 
13.8155 10.5966 9.2103 7.3778 5.9915 0.1026 0.0506 0.0201 0.0100 0.0020 
16.2662 12.8382 11.3449 9.3484 7.8147 0.3518 0.2158 0.1148 0.0717 0.0243 
18.4668 14.8603 13.2767 11.1433 9.4877 0.7107 0.4844 0.2971 0.2070 0.0908 
20.5150 16.7496 15.0863 12.8325 11.0705 1.1455 0.8312 0.5543 0.4117 0.2102 
22.4577 18.5476 16.8119 14.4494 12.5916 1.6354 1.2373 0.8721 0.6757 0.3811 
24.3219 20.2777 18.4753 16.0128 14.0671 2.1673 1.6899 1.2390 0.9893 0.5985 
26.1245 21.9550 20.0902 17.5345 15.5073 2.7326 2.1797 1.6465 1.3444 0.8571 
27.8772 23.5894 21.6660 19.0228 16.9190 3.3251 2.7004 2.0879 1.7349 1.1519 
10 29.5883 25.1882 23.2093 20.4832 18.3070 3.9403 3.2470 2.5582 2.1559 1.4787 

11 31.2641 26.7568 24.7250 21.9200 19.6751 4.5748 3.8157 3.0535 2.6032 1.8339 

12 32.9095 28.2995 26.2170 23.3367 21.0261 5.2260 4.4038 3.5706 3.0738 2.2142 

13 34.5282 29.8195 27.6882 24.7356 22.3620 5.8919 5.0088 4.1069 3.5650 2.6172 

14 36.1233 31.3193 29.1412 26.1189 23.6848 6.5706 5.6287 4.6604 4.0747 3.0407 

15 37.6973 32.8013 30.5779 27.4884 24.9958 7.2609 6.2621 5.2293 4.6009 3.4827 

16 39.2524 34.2672 31.9999 28.8454 26.2962 7.9616 6.9077 5.8122 5.1422 3.9416 

17 40.7902 35.7185 33.4087 30.1910 27.5871 8.6718 7.5642 6.4078 5.6972 4.4161 

18 42.3124 37.1565 34.8053 31.5264 28.8693 9.3905 8.2307 7.0149 6.2648 4.9048 

19 43.8202 38.5823 36.1909 32.8523 30.1435 10.1170 8.9065 7.6327 6.8440 5.4068 

20 45.3147 39.9968 37.5662 34.1696 31.4104 10.8508 9.5908 8.2604 7.4338 5.9210 

21 46.7970 41.4011 38.9322 35.4789 32.6706 11.5913 10.2829 8.8972 8.0337 6.4467 

22 48.2679 42.7957 40.2894 36.7807 33.9244 12.3380 10.9823 9.5425 8.6427 6.9830 

23 49.7282 44.1813 41.6384 38.0756 35.1725 13.0905 11.6886 10.1957 9.2604 7.5292 

24 51.1786 45.5585 42.9798 39.3641 36.4150 13.8484 12.4012 10.8564 9.8862 8.0849 

25 52.6197 46.9279 44.3141 40.6465 37.6525 14.6114 13.1197 11.5240 10.5197 8.6493 

26 54.0520 48.2899 45.6417 41.9232 38.8851 15.3792 13.8439 12.1981 11.1602 9.2221 

27 55.4760 49.6449 46.9629 43.1945 40.1133 16.1514 14.5734 12.8785 11.8076 9.8028 

28 56.8923 50.9934 48.2782 44.4608 41.3371 16.9279 15.3079 13.5647 12.4613 10.3909 

29 58.3012 52.3356 49.5879 45.7223 42.5570 17.7084 16.0471 14.2565 13.1211 10.9861 

30 59.7031 53.6720 50.8922 46.9792 43.7730 18.4927 16.7908 14.9535 13.7867 11.5880 

31 61.0983 55.0027 52.1914 48.2319 44.9853 19.2806 17.5387 15.6555 14.4578 12.1963 
32 62.4872 56.3281 53.4858 49.4804 46.1943 20.0719 18.2908 16.3622 15.1340 12.8107 

33 63.8701 57.6484 54.7755 50.7251- 47.3999 20.8665 19.0467 17.0735 15.8153 13.4309 

34 65.2472 58.9639 56.0609 51.9660 48.6024 21.6643 19.8063 17.7891 16.5013 14.0567 

35 66.6188 60.2748 57.3421 53.2033 49.8018 22.4650 20.5694 18.5089 17.1918 14.6878 

36 67.9852 61.5812 58.6192 54.4373 50.9985 23.2686 21.3359 19.2327 17.8867 15.3241 

37 69.3465 62.8833 59.8925 55.6680 52.1923 24.0749 22.1056 19.9602 18.5858 15:9653 

38 70.7029 64.1814 61.1621 56.8955 53.3835 24.8839 22.8785 20.6914 19.2889 16.6112 

39 72.0547 65.4756 62.4281 58.1201 54.5722 25.6954 23.6543 21.4262 19.9959 17.2616 

40 73.4020 66.7660 63.6907 59.3417 55.7585 26.5093 24.4330 22.1643 20.7065 17.9164 

41 74.7449 68.0527 64.9501 60.5606 56.9424 27.3256 25.2145 22.9056 21.4208 18.5754 
42 76.0838 69.3360 66.2062 61.7768 58.1240 28.1440 25.9987 23.6501 22.1385 19.2385 

43 77.4186 70.6159 67.4593 62.9904 59.3035 28.9647 26.7854 24.3976 22.8595 19.9055 

44 78.7495 71.8926 68.7095 64.2015 60.4809 29.7875 27.5746 25.1480 23.5837 20.5763 

á5 80.0767 73.1661 69.9568 65.4102 6t:6562 30.6123 28.3662 25.9013 24.3110 21.2507 

46 81.4003 74.4365 71.2014 66.6165 62.8296 31.4390 29.1601 26.6572 25.0413 21.9287 
47. 82.7204 75.7041 72.4433 67.8206 64.0011 32.2676 29.9562 27.4158 25.7746 22.6101 

48 84.0371 76.9688 73.6826 69.0226 65.1708 33.0981 30.7545 28.1770 26.5106 23.2949 

49 85.3506 78.2307 74.9195 70.2224 -66.3386 33.9303 31.5549 28.9406 27.2493 23.9828 

50 86.6608 79.4900 76.1539 71.4202 67.5048 34.7643 32.3574 29.7067 27.9907 24.6739 

60 99.6072 91.9517 88.3794 83.2977 79.0819 43.1880 40.4817 37.4849 35.5345 31.7383 

70 112.3169 104.2149 100.4252 95.0232 90.5312 51.7393 48.7576 45.4417 43.2752 39.0364 

80 124.8392 116.3211 112.3288 106.6286 101.8795 60.3915 57.1532 53.5401 51.1719 . 46.5199 

90 137.2084 128.2989 124.1163 118.1359 113.1453 69.1260 65.6466 61.7541 59.1963 54.1552 
100 149.4493 140.1695 135.8067 129.5612 124.3421 77.9295 74.2219 70.0649 67.3276 61.9179 


Y 0 Yom AUN = 


TABLAS 


Tabla E. Valores seleccionados de 1, (V). 
En la distribución + de Student con Y grados de libertad la tabla proporciona el valor tą(v) tal que P(t, = t¿(v))=0. 


0.01 0.005 0.0025 0.001 0.0005 0.00025 


1 1.0000 3.0777 6.3138 12.7062 31.8205 63.6567 127.3213 318.3088 636.6192 1273.2393 
2 0.8165 1.8856 2.9200 4.3027 6.9646 9.9248 14.0890 22.3271 31.5991 44.7046 
3 0.7649 1.6377 2.3534 3.1824 4.5407 5.8409 7.4533 10.2145 12.9240 16.3263 
4 0.7407 1.5332 2.1318 2.7764 3.7469 4.6041 5.5976 KLAR 8.6103 10.3063 
5 0.7267 1.4759 2.0150 2.5706 3.3649 4.0321 4.7733 5.8934 6.8688 7.9757 
6 0.7176 1.4398 1.9432 2.4469 3.1427 3.7074 4.3168 5.2076 5.9588 6.7883 
7 0.7111 1.4149 1.8946 2.3646 2.9980 3.4995 4.0293 4.7853 5.4079 6.0818 
8 0.7064 1.3968 1.8595 2.3060 2.8965 3.3554 3.8325 4.5008 5.0413 5.6174 
9 0.7027 1.3830 1.8331 2.2622 2.8214 3.2498 3.6897 4.2968 4.7809 5.2907 


10 0.6998 1.3722 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.5869 5.0490 
11 0.6974 1.3634 1.7959 2.2010 2.7181 3.1058 3.4966 4.0247 4.4370 4.8633 
12 0.6955 1.3562 1.7823 2.1788 2.6810 3.0545 3.4284 3.9296 4.3178 4.7165 
13 0.6938 1.3502 1.7709 2.1604 2.6503 3.0123 3.3725 3.8520 4.2208 4.5975 
14 0.6924 1.3450 1.7613 2.1448 2.6245 2.9768 3.9227 3.7874 4,1405 4.4992 
15 0.6912 1.3406 1.7531 2.1314 2.6025 2.9467 3.2860 3.7328 4.0728 4.4166 
16 0.6901 1.3368 1.7459 2.1199 2.5835 2.9208 3.2520 3.6862 4.0150 4.3463 
17 0.6892 1.3334 1.7396 2.1098 2.5669 2.8982 3.2224 3.6458 3.9651 4.2858 
18 0.6884 1.3304 1.7341 2.1009 2.5524 2.8784 3.1966 3.6105 3.9216 4.2332 
19 0.6876 1.3277 1.7291 2.0930 2.5395 2.8609 91737 3.5794 3.8834 4.1869 
20 0.6870 1.3253 1.7247 2.0860 2.5280 2.8453 3.1534 3.5518 3.8495 4.1460 
21 0.6864 1.3232 1.7207 2.0796 2.5176 2.8314 3.1352 3.5272 3.8193 4.1096 
22 0.6858 1.3212 17171 2.0739 2.5083 2.8188 3.1188 3.5050 3.7921 4.0769 
23 0.6853 1.3195 1.7139 2.0687 2.4999 2.8073 3.1040 3.4850 3.7676 4.0474 
24 0.6848 1.3178 1.7109 2.0639 2.4922 2.7969 3.0905 3.4668 3.7454 4.0207 
25 0.6844 1.3163 1.7081 2.0595 2.4851 2.7874 3.0782 3.4502 3.7251 3.9964 
26 0.6840 1.3150 1.7056 2.0555 2.4786 2.7787 3.0669 3.4350 3.7066 3.9742 
27 0.6837 1.3137 1.7033 2.0518 2.4727 2.7707 3.0565 3.4210 3.6896 3.9538 
28 0.6834 1.3125 1.7011 2.0484 2.4671 2.7633 3.0469 3.4082 3.6739 3.9351 
29 0.6830 1.3114 1.6991 2.0452 2.4620 2.7564 3.0380 3.3962 3.6594 3.9177 
30 0.6828 1.3104 1.6973 2.0423 2.4573 2.7500 3.0298 3.3852 3.6460 3.9016 
31 0.6825 1.3095 1.6955 2.0395 2.4528 2.7440 3.0221 3.3749 3.6335 3.8867 
32 0.6822 1.3086 1.6939 2.0369 2.4487 2.7385 3.0149 3.3653 3.6218 3.8728 
33 0.6820 1.3077 1.6924 2.0345 2.4448 231393 3.0082 3.3563 3.6109 3.8598 
34 0.6818 1.3070 1.6909 2.0322 2.4411 2.7284 3.0020 3.3479 3.6007 3.8476 
35 0.6816 1.3062 1.6896 2.0301 2.4377 2.7238 2.9960 3.3400 3.5911 3.8362 
36 0.6814 1.3055 1.6883 2.0281 2.4345 2.7195 2.9905 3.3326 3.5821 3.8255 
37 0.6812 1.3049 1.6871 2.0262 2.4314 2.7154 2.9852 3.3256 3.5737 3.8154 
38 0.6810 1.3042 1.6860 2.0244 2.4286 2.7116 2.9803 3.3190 3.5657 3.8059 
39 0.6808 1.3036 1.6849 2.0227 2.4258 2.7079 2.9756 3.3128 3.5581 3.7969 
40 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 2.9712 3.3069 3.5510 3.7884 
41 0.6805 1.3025 1.6829 2.0195 2.4208 2.7012 2.9670 3.3013 3.5442 3.7803 
42 0.6804 1.3020 1.6820 2.0181 2.4185 2.6981 2.9630 3.2960 3.5377 3.7727 
43 0.6802 1.3016 1.6811 2.0167 2.4163 2.6951 2.9592 3.2909 3.5316 3.7654 
44 0.6801 1.3011 1.6802 2.0154 2.4141 2.6923 2.9555 3.2861 3.5258 3.7585 
45 0.6800 1.3006 1.6794 2.0141 2.4121 2.6896 2.9521 3.2815 3.5203 3.7519 
46 0.6799 1.3002 1.6787 2.0129 2.4102 2.6870 2.9488 3.2771 3.5150 3.7456 
47 0.6797 1.2998 1.6779 2.0117 2.4083 2.6846 2.9456 3.2729 3.5099 3.7396 
48 0.6796 1.2994 1.6772 2.0106 2.4066 2.6822 2.9426 3.2689 3.5051 3.7339 
49 0.6795 1.2991 1.6766 2.0096 2.4049 2.6800 2.9397 3.2651 3.5004 3.7284 
50 0.6794 1.2987 1.6759 2.0086 2.4033 2.6778 2.9370 3.2614 3.4960 3.7231 
60 0.6786 1.2958 1.6706 2.0003 2.3901 2.6603 2.9146 3.2317 3.4602 3.6807 
70 0.6780 1.2938 1.6669 1.9944 2.3808 2.6479 2.8987 3.2108 3.4350 3.6509 
80 0.6776 1.2922 1.6641 1.9901 2.3739 2.6387 2.8870 3.1953 3.4163 3.6288 
90 0.6772 1.2910 1.6620 1.9867 2.3685 2.6316 2.8779 3.1833 3.4019 3.6118 
100 0.6770 1.2901 1.6602 1.9840 2.3642 2.6259 2.8707 3.1737 3.3905 3.5983 


_ YY PI DM TT iu zz == KKÁX2A 


MeéroDos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla F Valores seleccionados de £7510 
En la distribución F con m grados de libertad en el numerador y n grados de libertad en el denominador, la tabla proporciona 


valores E, ¡9 tales que P(E” > Fa) =0.10. 


n m 1 2 3 4 5 6 7 8 9 10 11 


1 39.863 49.500 53.593 55.833 57.240 58.204 58.906 59.439 59.858 60.195 60.473 

2 8.526 9.000 9.162 9.243 9.293 9.326 9.349 9.367 9.381 9.392 9.401 
3 5.538 5.462 5.391 5.343 5.309 5.285 5.266 5.252 5.240 5.230 5.222 
4 4.545 4.325 4.191 4.107 4.051 4.010 3.979 3.955 3.936 3.920 3.907 
5 4.060 3.780 3.619 3.520 3.453 3.405 3.368 3.339 3.316 3.297 3.282 
6 3.776 3.463 3.289 3.181 3.108 3.055 3.014 2.983 2.958 2.937 2.920 
7 3.589 3.257 3.074 2.961 2.883 2.827 2.785 2.752 2.725 2.703 2.684 
8 3.458 SL 2.924 2.806 2.726 2.668 2.624 2.589 2.561 2.538 2.519 
9 3.360 3.006 2.813 2.693 2.611 2.551 2.505 2.469 2.440 2.416 2.396 
10 3.285 2.924 2.728 2.605 2.522 2.461 2.414 2:377 2.347 2.323 2.302 
11 3.225 2.860 2.660 2.536 2.451 2.389 2.342 2.304 2.274 2.248 2.227 
12 3:177 2.807 2.606 2.480 2.394 2.331 2.283 2.245 2.214 2.188 2.166 
13 3.136 2.763 2.560 2.434 2.347 2.283 2.234 2.195 2.164 2.138 2.116 
14 3.102 2.726 2.522 2.395 2.307 2.243 2.193 2.154 2.122 2.095 2.073 
15 3.073 2.695 2.490 2.361 2.273 2.208 2.158 2.119 2.086 2.059 2.037 
16 3.048 2.668 2.462 2.333 2.244 2.178 2.128 2.088 2.055 2.028 2.005 
17 3.026 2.645 2.437 2.308 2.218 2.152 2.102 2.061 2.028 2.001 1.978 
18 3.007 2.624 2.416 2.286 2.196 2.130 2.079 2.038 2.005 1.977 1.954 
19 2.990 2.606 2.397 2.266 2.176 2.109 2.058 2.017 1.984 1.956 1.932 
20 2.975 2.589 2.380 2.249 2.158 2.091 2.040 1.999 1.965 1.937 1:913 
21 2.961 2.575 2.365 2299 2.142 2.075 2.023 1.982 1.948 1.920 1.896 
22 2.949 2.561 2.351 2.219 2.128 2.060 2.008 1.967 1.933 1.904 1.880 
23 2.937 2.549 2.339 2.207 2.115 2.047 1.995 1.953 1.919 1.890 1.866 
24 2.927 2.538 2.327 2.195 2.103 2.035 1.983 1.941 1.906 1.877 1.853 
25 2.918 2.528 2.317 2.184 2.092 2.024 1.971 1.929 1.895 1.866 1.841 
26 2.909 2.519 2.307 2.174 2.082 2.014 1.961 1.919 1.884 1.855 1.830 
27 2.901 2.511 2.299 2.165 2.073 2.005 1.952 1.909 1.874 1.845 1.820 
28 2.894 2.503 2.291 2.157 2.064 1.996 1.943 1.900 1.865 1.836 1.811 
29 2.887 2.495 2.283 2.149 2.057 1.988 1.935 1.892 1.857 1.827 1.802 
30 2.881 2.489 2.276 2.142 2.049 1.980 1.927 1.884 1.849 1.819 1.794 
31 2.875 2.482 2.270 2.136 2.042 1.973 1.920 1.877 1.842 1.812 1.787 
32 2.869 2.477 2.263 2.129 2.036 1.967 1.913 1.870 1.835 1.805 1.780 
33 2.864 2.471 2.258 2.123 2.030 1.961 1.907 1.864 1.828 1.799 1.773 
34 2.859 2.466 2.252 2.118 2.024 1.955 1.901 1.858 1.822 1.793 1.767 
35 2.855 2.461 2.247 2.113 2.019 1.950 1.896 1.852 1.817 1.787 1.761 
36 2.850 2.456 2.243 2.108 2.014 1.945 1.891 1.847 1.811 1.781 1.756 
37 2.846 2.452 2.238 2.103 2.009 1.940 1.886 1.842 1.806 1.776 1.751 
38 2.842 2.448 2.234 2.099 2.005 1:935 1.881 1.838 1.802 1.772 1.746 
39 2.839 2.444 2.230 2.095 2.001 1.931 1.877 1.833 1.797 1.767 1.741 
40 2.835 2.440 2.226 2.091 1.997 1.927 1.873 1.829 1.793 1.763 1.737 
50 2.809 2.412 2.197 2.061 1.966 1.895 1.840 1.796 1.760 1:729 1.703 
60 2.791 2.393 2.177 2.041 1.946 1.875 1.819 1.775 1.738 1.707 1.680 
70 2.779 2.380 2.164 2.027 1.931 1.860 1.804 1.760 1.723 1.691 1.665 
80 2.769 2.370 2.154 2.016 1.921 1.849 1.793 1.748 1.711 1.680 1.653 
90 2.762 2.363 2.146 2.008 1.912 1.841 1.785 1:739 1.702 1.670 1.643 
100 2.756 2.356 2.139 2.002 1.906 1.834 1.778 1.732 1.695 1.663 1.636 
110 2.732 2.351 2.134 1.997 1.900 1.828 1.772 1.727 1.689 1.657 1.630 
120 2.748 2.347 2.130 1.992 1.896 1.824 1.767 1.722 1.684 1.652 1.625 
200 2.731 2.329 2.111 1.973 1.876 1.804 1.747 1.701 1.663 1.631 1.603 


500 2.716 2.313 2.095 1.956 1.859 1.786 1.729 1.683 1.644 1.612 1.583 
A 2272 A OY LS 1/Y 16009 16044 1612 1.583 


12 


60.705 
9.408 
5.216 
3.896 
3.268 
2.905 
2.668 
2.502 
2.379 
2.284 
2.209 
2.147 
2.097 
2.054 
2.017 
1.985 
1.958 
1.933 
1.912 
1.892 
1.875 
1.859 
1.845 
1.832 
1.820 
1.809 
1.799 
1.790 
1.781 
1.779 
1.765 
1.758 
1.751 
1.745 
1.739 
1.734 
1.729 
1.724 
1.719 
LA 
1.680 
1.657 
1.641 
1.629 
1.620 
1.612 
1.606 
1.601 
1.579 
1.559 


13 


60.903 
9.415 
5.210 
3.886 
3.237 
2.892 
2.654 
2.488 
2.364 
2.269 
2:193 
2.131 
2.080 
2.037 
2.000 
1.968 
1.940 
1.916 
1.894 
1.875 
1.857 
1.841 
1.827 
1.814 
1.802 
1.790 
1.780 
1.771 
1.762 
1.754 
1.746 
1.739 
1.732 
1.726 
1.720 
1.715 
1.709 
1.704 
1.700 
1.695 
1.660 
1.637 
1.621 
1.609 
1.39) 
1.592 
1.585 
1.580 
1.558 
1.537 


14 


61.073 
9.420 
5.205 
3.878 
3.247 
2.881 
2.643 
2.475 
2.351 
2:29) 
2.179 
2.117 
2.066 
2.022 
1.985 
1.953 
1.925 
1.900 
1.878 
1.859 
1.841 
1.825 
1.811 
10797 
1.785 
1.774 
1.764 
1.754 
1.745 
1.737 
1.729 
1.722 
1.715 
1.709 
1.703 
1.697 
1.692 
1.687 
1.682 
1.678 
1.643 
1.619 
1.603 
1.590 
1.581 
1.573 
1.567 
1.562 
1.539 
1.518 


15 


61.220 
9.425 
5.200 
3.870 
3.238 
2.871 
2.632 
2.464 
2.340 
2.244 
2.167 
2.105 
2.053 
2.010 
1.972 
1.940 
1.912 
1.887 
1.865 
1.845 
1.827 
1.811 
1.796 
1.783 
1.771 
1.760 
1.749 
1.740 
1.731 
1.722 
1.714 
1.707 
1.700 
1.694 
1.688 
1.682 
1.677 
1.672 
1.667 
1.662 
1.627 
1.603 
1.587 
1.574 
1.564 
1.557 
1.550 
1.545 
1.522 
1.501 


20 


61.740 
9.441 
5.184 
3.844 
3.207 
2.836 
2.595 
2.425 
2.298 
2.201 
2.129 
2.060 
2.007 
1.962 
1.924 
1.891 
1.862 
1.837 
1.814 
1.794 
1.776 
1.759 
1.744 
1.730 
1.718 
1.706 
1.695 
1.685 
1.676 
1.667 
1.659 
1.652 
1.645 
1.638 
1.632 
1.626 
1.620 
1.615 
1.610 
1.605 
1.568 
1.543 
1.526 
1.513 
1.503 
1.494 
1.488 
1.482 
1.458 
1.435 


24 


62.002 
9.450 
5.176 
3.831 
3.191 
2.818 
2.575 
2.404 
2277 
2.178 
2.100 
2.036 
1.983 
1.938 
1.899 
1.866 
1.836 
1.810 
1.787 
1.767 
1.748 
1.731 
1.716 
1.702 
1.689 
1.677 
1.666 
1.656 
1.647 
1.638 
1.630 
1.622 
1.615 
1.608 
1.601 
1.595 
1.590 
1.584 
1.579 
1.574 
1.536 
1.511 
1.493 
1.479 
1.468 
1.460 
1.453 
1.447 
1.422 
1.399 


30 


62.265 
9,458 
5.168 
3.817 
3.174 
2.800 
21D) 
2.383 
2.255 
2.155 
2.076 
2.011 
1.958 
1:912 
1.873 
1.839 
1.809 
1.783 
1.759 
1.738 
1:719 
1.702 
1.686 
1.672 
1.659 
1.647 
1.636 
1.625 
1.616 
1.606 
1.598 
1.590 
1.583 
1.576 
1.569 
1.563 
1.557 
1.551 
1.546 
1.541 
1.502 
1.476 
1.457 
1.443 
1.432 
1.423 
1.415 
1.409 
1.383 
1.358 


40 


62.529 
9.466 
5.160 
3.804 
3.157 
2.781 
2.535 
2.361 
2.232 
2.132 
2.052 
1.986 
1.931 
1.885 
1.845 
1.811 
1.781 
1.754 
1.730 
1.708 
1.689 
1.671 
1.655 
1.641 
1.627 
1.615 
1.603 
1.592 
1.583 
1.573 
1.565 
1.556 
1.549 
1.541 
1:533 
1.528 
1.522 
1.516 
1.511 
1.506 
1.465 
1.437 
1.418 
1.403 
1.391 
1.382 
1.374 
1.368 
1.339 
1.313 


60 


62.794 
9.475 
5.151 
3.790 
3.140 
2.762 
2.514 
2.339 
2.208 
2.107 
2.026 
1.960 
1.904 
1.857 
1.817 
1.782 
1.751 
1.723 
1.699 
1.677 
1.657 
1.639 
1.622 
1.607 
1.593 
1.581 
1.569 
1.558 
1.547 
1.538 
1.529 
1.520 
1.512 
1.505 
1.497 
1.491 
1.484 
1.478 
1.473 
1.467 
1.424 
1.395 
1.374 
1.358 
1.346 
1.336 
1.327 
1.320 
1.289 
1.260 


120 


63.061 
9.483 
5.143 
3.775 
3.123 
2.742 
2.493 
2.316 
2.184 
2.082 
2.000 
1.932 
1.876 
1.828 
1.787 
1.751 
1.719 
1.691 
1.666 
1.643 
1.623 
1.604 
1.587 
1.571 
1,397 
1.544 
1.531 
1.520 
1.509 
1.499 
1.489 
1.481 
1.472 
1.464 
1.457 
1.450 
1.443 
1.437 
1.431 
1.425 
1.379 
1.348 
1.325 
1.307 
1.293 
1.282 
1.272 
1.265 
1.228 
1.194 


500 


63.264 
9.489 
5.136 
3.764 
3.109 
2727 
2.476 
2.298 
2.165 
2.062 
1.979 
1,911 
1.853 
1.805 
1.763 
1.726 
1.694 
1.665 
1.639 
1.616 
1.595 
1.576 
1.558 
1.542 
1.527 
1.514 
1.501 
1.489 
1.478 
1.467 
1.457 
1.448 
1.439 
1.431 
1.423 
1.415 
1.408 
1.402 
1.395 
1.389 
1.340 
1.306 
1.281 
1.261 
1.245 
1.232 
1.221 
1.212 
1.168 
1.122 


TABLAS 


Meronos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla G. Valores seleccionados de Æ” ys. 


n 


En la distribución F con m grados de libertad en el numerador y » grados de libertad en el denominador, la tabla proporciona 
valores F”.os tales que P(E” > cs) =0.05. 


n m 1 2 3 4 5 6 7 8 9 10 11 


1 161.448 199.500 215.707 224.583 230.162 233.986 236.768 238.883 240.543 241.882 242.983 

2 18.513 19.000 19.164 19.247 19.296 19:330 19:353 12:371 19.385 19.396 19.405 

3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.786 8.763 

4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.936 

5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.704 

6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 4.027 
7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.603 

8 5.318 4.459 4.066 3.838 3.687 3.581 3.500 3.438 3.388 3.347 3.313 

9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3:179 3.197 3.102 
10 4.965 4.103 3.708 3.478 3.326 3217 3.135 3.072 3.020 2.978 2.943 
11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.818 
12 4.747 3.885 3.490 3239 3.106 2.996 2:913 2.849 2.796 2.753 2.717 
13 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671 2.635 
14 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602 2.565 
15 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544 2.507 
16 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494 2.456 
17 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450 2.413 
18 4.414 3.555 3.160 2.928 2.773 2.661 EAT 2.510 2.456 2.412 2.374 
19 4.381 3922 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378 2.340 
20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.310 
21 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321 2.283 
22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 2.259 
23 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275 2.236 
24 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.393 2.300 2.255 2.216 
25 4.242 3.385 2.991 2.739 2.603 2.490 2.405 2.337 2.282 2.236 2.198 
26 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220 2.181 
27 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204 2.166 
28 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190 2.151 
29 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 LAIR 2.138 
30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 2.126 
31 4.160 3.305 2.911 2.679 2.523 2.409 2.323 2233 2.199 2.153 2.114 
32 4.149 3.295 2.901 2.668 2.312 2.399 2319 2.244 2.189 2.142 2.103 
33 4.139 3.285 2.892 2.659 2.503 2.389 2.303 2.235 2.179 2.133 2.093 
34 4.130 3.276 2.883 2.650 2.494 2.380 2.294 2.225 2.170 2.123 2.084 
35 4.121 3.267 2.874 2.641 2.485 2.372 2.285 2.217 2.161 2.114 2.075 
36 4.113 3.259 2.866 2.634 2.477 2.364 2:217 2.209 2.153 2.106 2.067 
37 4.105 3.252 2.859 2.626 2.470 2.356 2.270 2.201 2.145 2.098 2.059 
38 4.098 3.245 2.852 2.619 2.463 2.349 2.262 2.194 2.138 2.091 2.051 
39 4.091 3.238 2.845 2.612 2.456 2.342 2.255 2.187 2.131 2.084 2.044 
40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 2.038 
50 4.034 3.183 2.790 2.557 2.400 2.286 2,199 2.130 2.073 2.026 1.986 
60 4.001 3.150 2.758 2:32) 2.368 2.254 2.167 2.097 2.040 1.993 1.952 
70 3.978 3.128 2.736 2.503 2.346 2.231 2.143 2.074 2.017 1.969 1.928 
80 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.999 1.951 1.910 
90 3.947 3.098 2.706 2.473 2.316 2.201 2.113 2.043 1.986 1.938 1.897 
100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.975 1:927 1.886 
110 3.927 3.079 2.687 2.454 2.297 2.182 2.094 2.024 1.966 1.918 1.877 
120 3.920 3.072 2.680 2.447 2.290 2.175 2.087 2.016 1.959 1.910 1.869 
200 3.888 3.041 2.650 2.417 2.259 2.144 2.056 1.985 1.927 1.878 1.837 
500 3.860 3.014 2.623 2.390 2.232 2.117 2.028 1.957 1.899 1.850 1.808 


12 


243.906 
19.413 
8.745 
5.912 
4.678 
4.000 
3.575 
3.284 
3.073 
2913 
2.788 
2.687 
2.604 
2.534 
2.475 
2.425 
2.381 
2.342 
2.308 
2.278 
2.250 
2.226 
2.204 
2.183 
2.165 
2.148 
2.132 
2.118 
2.104 
2.092 
2.080 
2.070 
2.060 
2.050 
2.041 
2.033 
2.025 
2.017 
2.010 
2.003 
1.952 
1.917 
1.893 
1.875 
1.861 
1.850 
1.841 
1.834 
1.801 
1.772 


13 


244.690 
19.419 
8.729 
5.891 
4.655 
3.976 
3.550 
3.239 
3.048 
2.887 
2.761 
2.660 
2.377 
2.507 
2.448 
2.397 
2.353 
2.314 
2.280 
2.250 
2222 
2.198 
2.175 
2.155 
2.136 
2.119 
2.103 
2.089 
2.075 
2.063 
2.051 
2.040 
2.030 
2.021 
2.012 
2.003 
1.995 
1.988 
1.981 
1.974 
1.921 
1.887 
1.863 
1.845 
1.830 
1.819 
1.810 
1.803 
1.769 
1.740 


14 


245.364 
19.424 
8.715 
5.873 
4.636 
3.956 
3.529 
3.237 
3.025 
2.865 
LTI 
2.637 
2.554 
2.484 
2.424 
2.373 
2.329 
2.290 
2.256 
2.225 
2.197 
2.173 
2.150 
2.130 
2.111 
2.094 
2.078 
2.064 
2.050 
2.037 
2.026 
2.015 
2.004 
1.995 
1.986 
1,977 
1.969 
1.962 
1.954 
1.948 
1.895 
1.860 
1.836 
1.817 
1.803 
1.792 
1.783 
1775 
1.742 
1.712 


15 


245.950 
19.429 
8.703 
5.858 
4.619 
3.938 
3.511 
3.218 
3.006 
2.845 
2.719 
2.617 
2.533 
2.463 
2.403 
2.352 
2.308 
2.269 
2.234 
2.203 
2.176 
2.151 
2.128 
2.108 
2.089 
2.072 
2.056 
2.041 
2.027 
2.015 
2.003 
1.992 
1.982 
1.972 
1.963 
1.954 
1.946 
1.939 
1.931 
1.924 
1.871 
1.836 
1.812 
1.793 
1.779 
1.768 
1.758 
1.750 
LIV 
1.686 


20 


248.013 
19.446 
8.660 
5.803 
4.558 
3.874 
3.445 
3.150 
2.936 
2.774 
2.646 
2.544 
2.459 
2.388 
2.328 
2.276 
2.230 
2.191 
2.155 
2.124 
2.096 
2.071 
2.048 
2.027 
2.007 
1.990 
1.974 
1.959 
1.945 
1.932 
1.920 
1.908 
1.898 
1.888 
1.878 
1.870 
1.861 
1.853 
1.846 
1.839 
1.784 
1.748 
1.722 
1.703 
1.688 
1.676 
1.667 
1.659 
1.623 
1.592 


24 


249.052 
19.454 
8.639 
5.774 
4.527 
3.841 
3.410 
3.115 
2.900 
2,737 
2.609 
2.505 
2.420 
2.349 
2.288 
2.235 
2.190 
2.150 
2.114 
2.082 
2.054 
2.028 
2.005 
1.984 
1.964 
1.946 
1.930 
1.915 
1.901 
1.887 
1.875 
1.864 
1.853 
1.843 
1.833 
1.824 
1.816 
1.808 
1.800 
1.793 
1.737 
1.700 
1.674 
1.654 
1.639 
1.627 
1.617 
1.608 
1.572 
1.539 


30 


250.095 
19.462 
8.617 
5.746 
4.496 
3.808 
3.376 
3.079 
2.864 
2.700 
2.570 
2.466 
2.380 
2.308 
2.247 
2.194 
2.148 
2.107 
2.071 
2.039 
2.010 
1.984 
1.961 
1.939 
1.919 
1.901 
1.884 
1.869 
1.854 
1.841 
1.828 
1.817 
1.806 
1.795 
1.786 
1.776 
1.768 
1.760 
1.752 
1.744 
1.687 
1.649 
1.622 
1.602 
1.586 
1:573 
1.563 
1.554 
1.516 
1.482 


40 


251.143 
19.471 
8.594 
IAA 
4.464 
3.774 
3.340 
3.043 
2.826 
2.661 
2.531 
2.426 
2.339 
2.266 
2.204 
2.151 
2.104 
2.063 
2.026 
1.994 
1.965 
1.938 
1.914 
1.892 
1.872 
1.853 
1.836 
1.820 
1.806 
1.792 
1.779 
1.767 
1.756 
1.745 
1.735 
1.726 
1.717 
1.708 
1.700 
1.693 
1.634 
1.594 
1.566 
1.545 
1.528 
1513 
1.504 
1.495 
1.455 
1.419 


60 


252.196 
19.479 
8.572 
5.688 
4.431 
3.740 
3.304 
3.005 
2.787 
2.621 
2.490 
2.384 
2.297 
2.223 
2.160 
2.106 
2.058 
2.017 
1.980 
1.946 
1.916 
1.889 
1.865 
1.842 
1.822 
1.803 
1.785 
1.769 
1.754 
1.740 
1.726 
1.714 
1.702 
1.691 
1.681 
1.671 
1.662 
1.653 
1.645 
1.637 
1.576 
1.534 
1.505 
1.482 
1.465 
1.450 
1.439 
1.429 
1.386 
1.345 


120 


253.253 
19.487 
8.549 
5.658 
4.398 
3.705 
3.267 
2.967 
2.748 
2.580 
2.448 
2.341 
2.252 
2.178 
2.114 
2.059 
2.011 
1.968 
1.930 
1.896 
1.866 
1.838 
1.813 
1.790 
1.768 
1.749 
1.731 
1.714 
1.698 
1.683 
1.670 
1.657 
1.645 
1.633 
1.623 
1.612 
1.603 
1.594 
1.585 
1.577 
1.511 
1.467 
1.435 
1.411 
1.391 
1.376 
1.363 
1.352 
1.302 
1.255 


500 


254.059 
19.494 
8.532 
5.635 
4.373 
3.678 
3.239 
2.937 
2.717 
2.548 
2.415 
2.307 
2.218 
2.142 
2.078 
2.022 
1.973 
1.929 
1.891 
1.856 
1.825 
1.797 
1.771 
1.747 
1.725 
1.705 
1.686 
1.669 
1.653 
1.637 
1.623 
1.610 
1.597 
1.585 
1.574 
1.564 
1.553 
1.544 
1.535 
1.526 
1.457 
1.409 
1.374 
1.347 
1.326 
1.308 
1.293 
1.280 
1.221 
1.159 


TABLAS 


Meropos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla H. Valores seleccionados de F7% 025- 
En la distribución F con m grados de libertad en el numerador y » grados de libertad en el denominador, la tabla proporciona 


valores F% 975 tales que p(E” > Far) = 0.025. 
n o 1 2 3 4 5 6 7 8 9 10 11 


1 647.789 799.500 864.163 899.583 921.848 937.111 948.217 956.656 963.285 968.627 973.025 
2 38.506 39.000 39.165 39.248 39,298 39.331 39.355 39.373 39.387 39.398 39.407 
3 17.443 16.044 15.439 15.101 14.885 14.735 14.624 14.540 14.473 14.419 14.374 
4 12.218 10.649 9.979 9.605 9.364 9.197 9.074 8.980 8.905 8.844 8.794 
5 10.007 8.434 7.764 7.388 7.146 6.978 6.853 6.757 6.681 6.619 6.568 
6 8.813 7.260 6.599 6.227 5.988 5.820 5.695 5.600 5:923 5.461 5.410 
7 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.823 4.761 4.709 
8 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.357 4.295 4.243 
9 7.209 5.715 5.078 4.718 4,484 4.320 4.197 4.102 4.026 3.964 3.912 
10 6.937 5.456 4.826 4.468 4.236 4.072 3.950 3.855 3.779 IIS 3.665 
11 6.724 5.256 4.630 4.275 4.044 3.881 3799 3.664 3.588 3.526 3.474 
12 6.554 5.096 4.474 4.121 3.891 3.728 3.607 3.312 3.436 3.374 3.321 
13 6.414 4.965 4.347 3.996 3.767 3.604 3.483 3.388 3.312 3.250 3.197 
14 6.298 4.857 4.242 3.892 3.663 3.501 3.380 3.285 3.209 3.147 3.095 
15 6.200 4.765 4.153 3.804 3.576 3.415 3.293 3.199 3.123 3.060 3.008 
16 6.115 4.687 4.077 3.729 3.502 3.341 3.219 2:125 3.049 2.986 2.934 
17 6.042 4.619 4.011 3.665 3.438 3.277 3.156 3.061 2.985 2.922 2.870 
18 5.978 4.560 3.954 3.608 3.382 3.221 3.100 3.005 2.929 2.866 2.814 
19 5.922 4.508 3.903 3.559 3.333 3.172 3.051 2.956 2.880 2.817 2.765 
20 5.871 4.461 3.859 3.515 3.289 3.128 3.007 2.913 2.837 2.774 2.721 
21 5.827 4.420 3.819 3.475 3.250 3.090 2.969 2.874 2.798 2.735 2.682 
22 5.786 4.383 3.783 3.440 3.215 3.055 2.934 2.839 2.763 2.700 2.647 
23 5.750 4.349 3.750 3.408 3.183 3.023 2.902 2.808 2.731 2.668 2.615 
24 5.717 4.319 3.721 3.379 3.155 2.995 2.874 2.779 2.703 2.640 2.586 
25 5.686 4.291 3.694 3.353 3.129 2.969 2.848 2.753 2.677 2.613 2.560 
26 5.659 4.265 3.670 3.329 3.105 2.945 2.824 2.729 2.653 2.590 2.536 
27 5.633 4.242 3.647 3.307 3.083 2.923 2.802 2.707 2.631 2.568 2.514 
28 5.610 4.221 3.626 3.286 3.063 2.903 2.782 2.687 2.611 2.547 2.494 
29 5.588 4.201 3.607 3.267 3.044 2.884 2.763 2.669 2.592 2.529 2.475 
30 5.568 4.182 3.589 3.250 3.026 2.867 2.746 2.651 2.575 2.511 2.458 
31 5.549 4.165 3:372 3.234 3.010 2.851 2.730 2.635 2.558 2.495 2.442 
32 5.531 4.149 3.557 3.218 2.995 2.836 2.715 2.620 2.543 2.480 2.426 
33 5.515 4.134 3.543 3.204 2.981 2.822 2.701 2.606 2.529 2.466 2.412 
34 5.499 4.120 3.529 3.191 2.968 2.808 2.688 2.593 2.516 2.453 2.399 
$0 5.485 4.106 3.517 3.179 2.956 2.796 2.676 2.581 2.504 2.440 2.387 
36 5.471 4.094 3.505 3.167 2.944 2.785 2.664 2.569 2.492 2.429 2.375 
37 5.458 4.082 3.493 3.156 2.933 2.774 2.653 2.558 2.481 2.418 2.364 
38 5.446 4.071 3.483 3.145 2.923 2.763 2.643 2.548 2.471 2.407 2.353 
39 5.435 4.061 3.473 3.135 2.913 2.754 2.633 2.538 2.461 2.397 2.344 
40 5.424 4.051 3.463 3.126 2.904 2.744 2.624 2.529 2.452 2.388 2.334 
50 5.340 3.975 3.390 3.054 2.833 2.674 2.553 2.458 2.381 2.317 2.263 
60 5.286 3.925 3.343 3.008 2.786 2.627 2.507 2.412 2.334 2.270 2.216 
70 5.247 3.890 3.309 2975 2.754 2.595 2.474 2:379 2.302 2.237 2.183 
80 5.218 3.864 3.284 2.950 2.730 2.571 2.450 2.355 2.277 2.213 2.158 
90 5.196 3.844 3.265 2.932 2.711 2.552 2.432 2.336 2.259 2.194 2.140 
100 5.179 3.828 3.250 2.917 2.696 2.537 2.417 2.321 2.244 2.179 2.124 
110 5.164 3.815 3.237 2.904 2.684 2.525 2.405 2.309 2.232 2.167 2.112 
120 5.152 3.805 3.227 2.894 2.674 2515 2.395 2.299 2.222 2.157 2.102 
200 5.100 3.758 3.182 2.850 2.630 2.472 2.351 2.256 2.178 2.113 2.058 


500 5.054 3.716 3.142 2.811 2.592 2.434 2.313 2217 2.139 2.074 2.019 
—_ A 222 YE» EA" EY Y» Y 0 > 201 


12 


976.708 
39.415 
14.337 

8.751 
6.525 
5.366 
4.666 
4.200 
3.868 
3.621 
3.430 
3.277 
3.153 
3.050 
2.963 
2.889 
2.825 
2.769 
2.720 
2.676 
2.637 
2.602 
2.570 
2.541 
2.515 
2.491 
2.469 
2.448 
2.430 
2.412 
2.396 
2.381 
2.366 
2.393 
2.341 
2:329 
2.318 
2.307 
2.298 
2.288 
2.216 
2.169 
2.136 
508 1 
2.092 
2.077 
2.065 
2.055 
2.010 
1.971 


13 


979.837 
39.421 
14.304 

8.715 
6.488 
13029 
4.628 
4.162 
3.831 
3.583 
3.392 
3.239 
ES? 
3.012 
LILA 
2.851 
2.786 
2.730 
2.681 
2.637 
2.598 
2.563 
2.531 
2.502 
2.476 
2.451 
2.429 
2.409 
2.390 
2.372 
2.356 
2.341 
2.327 
2.313 
2.301 

2.289 
2.278 
2.267 
2.257 
2.248 
2.176 
2.129 
2.095 
2.071 

2.051 

2.036 
2.024 
2.014 
1.969 
1.929 


14 


982.528 
39.427 
14.277 

8.684 
6.456 
5.297 
4.596 
4.130 
3.798 
3.550 
3.359 
3.206 
3.082 
2.979 
2.891 
2.817 
2.753 
2.696 
2.647 
2.603 
2.564 
2.528 
2.497 
2.468 
2.441 
2.417 
2.395 
2.374 
2.355 
2.338 
2.321 
2.306 
2292 
2.278 
2.266 
2.254 
2.243 
2.232 
2.222 
2.213 
2.140 
2.093 
2.059 
2.035 
2.015 
2.000 
1.988 
L9TT 
1.932 
1,892 


15 


984.867 
39.431 
14.253 

8.657 
6.428 
5.269 
4.568 
4.101 
3.769 
3.522 
3.330 
3.177 
3.053 
2.949 
2.862 
2.788 
2.723 
2.667 
2.617 
2.573 
2.534 
2.498 
2.466 
2.437 
2.411 
2.387 
2.364 
2.344 
2.325 
2.307 
2.291 
2.275 
2.261 

2.248 
2.235 
2.223 
PRAN 
2.201 

2.191 

2.182 
2.109 
2.061 

2.028 
2.003 
1.983 
1.968 
1.955 
1.945 
1.900 
1.859 


20 


993.103 
39.448 
14.167 

8.560 
6.329 
5.168 
4.467 
3.999 
3.667 
3.419 
3.226 
3.073 
2.948 
2.844 
2.756 
2.681 
2.616 
2.559 
2.509 
2.464 
2.425 
2.389 
2.37 
2.327 
2.300 
2.276 
2.253 
2.232 
2.213 
2:195 
2.178 
2.163 
2.148 
2.135 
2.122 
2.110 
2.098 
2.088 
2.077 
2.068 
1.993 
1.944 
1.910 
1.884 
1.864 
1.849 
1.836 
1.825 
1.778 
1.736 


24 


997.249 
39.456 
14.124 

8.511 
6.278 
HLI 
4.415 
3.947 
3.614 
3.365 
3.173 
3.019 
2.893 
2.789 
2.701 
2.625 
2.560 
2.503 
2.452 
2.408 
2.368 
2.331 
2.299 
2.269 
2.242 
2.217 
2.195 
2.174 
2.154 
2.136 
2.119 
2.103 
2.088 
2.075 
2.062 
2.049 
2.038 
2.027 
2.017 
2.007 
1.931 
1.882 
1.847 
1.820 
1.800 
1.784 
1.771 
1.760 
1:712 
1.669 


120 


500 


1001.414 1005.598 1009.800 1014.020 1017.240 


30 40 60 
39.465 39.473 39.481 
14.081 14.037 13.992 

8.461 8.411 8.360 

6.227 6.175 6.123 

5.065 5.012 4.959 

4.362 4.309 4.254 

3.894 3.840 3.784 

3.560 3.505 3.449 

3.311 3.255 3.198 

3.118 3.061 3.004 

2.963 2.906 2.848 

2.837 2.780 2.720 

2.732 2.674 2.614 

2.644 2.585 2.524 

2.568 2.509 2.447 

2.502 2.442 2.380 

2.445 2.384 2.321 

2.394 2.333 2.270 

2.349 2.287 2.223 

2.308 2.246 2.182 

2.272 2.210 2.145 

2.239 2.176 2.111 

2.209 2.146 2.080 

2.182 2.118 2.052 

2.157 2.093 2.026 

2.133 2.069 2.002 

2.112 2.048 1.980 

2.092 2.028 1.959 

2.074 2.009 1.940 

2.057 1.991 1.922 

2.041 1.975 1.905 

2.026 1.960 1.890 
2.012 1.946 1.875 
1.999 1.932 1.861 

1.986 1:919 1.848 

1.974 1.907 1.836 

1.963 1.896 1.824 

1.953 1.885 1.813 

1.943 1.875 1.803 

1.866 1.796 1.721 

1.815 1.744 1.667 

1779 1.707 1.628 

1.752 1.679 1.599 

1.731 1.657 1.576 

1.715 1.640 1.558 

1.701 1.626 1.543 

1.690 1.614 1.530 

1.640 1.562 1.474 

1.596 1.515 1.423 


39.490 
13.947 
8.309 
6.069 
4.904 
4.199 
3.728 
3.392 
3.140 
2.944 
2.787 
2.659 
2.552 
2.461 
2.383 
2315 
2.256 
2.203 
2.156 
2.114 
2.076 
2.041 
2.010 
1.981 
1.954 
1.930 
1.907 
1.886 
1.866 
1.848 
1.831 
1.815 
1.799 
1.785 
1,772 
1.759 
1.747 
1.735 
1.724 
1.639 
1.581 
1.539 
1.508 
1.483 
1.463 
1.447 
1.433 
1.370 
1.311 


39.496 
13:913 
8.270 
6.028 
4.862 
4.156 
3.684 
3.347 
3.094 
2.898 
2.740 
2.611 
2.503 
2.411 
2.333 
2.264 
2.204 
2.150 
2.103 
2.060 
2.021 
1.986 
1.954 
1.924 
1.897 
1.872 
1.848 
1.827 
1.806 
1.788 
1.770 
1.753 
1.737 
1.722 
1.708 
1.695 
1.682 
1.670 
1.659 
1.569 
1.507 
1.463 
1.428 
1.401 
1.378 
1.359 
1.343 
1.269 
1,192 


TABLAS 


Merobos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla I. Valores seleccionados de £” q; . 
En la distribución F con m grados de libertad en el numerador y » grados de libertad en el denominador, la tabla proporciona 


valores F’ġo, tal que P(E” 2 Fod ) =0.01. 


n m 1 2 3 4 p 6 7 8 9 10 11 


1 4052.181 4999.500 5403.352 5624.583 5763.650 5858.986 5928.356 5981.070 6022.473 6055.847 6083.317 
2 98.503 99.000 99.166 99.249 99.299 99.333 99.356 99.374 99.388 99.399 99.408 
3 34.116 30.817 29.457 28.710 28.237 27.911 27.672 27.489 27.345 27.229 27.133 
4 21.198 18.000 16.694 15:977 15.522 15.207 14.976 14.799 14.659 14.546 14.452 
5 16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.963 
6 13.745 10.925 9.780 9.148 8.746 8.466 8.260 8.102 7.976 7.874 7.790 
7 12.246 9.547 8.451 7.847 7.460 7.191 6.993 6.840 6.719 6.620 6.538 
8 11:239 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814 5.734 
9 10.561 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257 5.178 
10 10.044 7:399 6.552 5.994 5.636 5.386 5.200 5.057 4.942 4.849 4.772 


11 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.462 
12 9.330 6.927 5.953 5.412 5.064 4.821 4.640 4.499 4.388 4.296 4.220 
13 9.074 6.701 5.739 5.205 4.862 4.620 4.441 4.302 4.191 4.100 4.025 
14 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.140 4.030 3.939 3.864 
15 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805 3.730 
16 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.890 3.780 3.691 3.616 
17 8.400 6.112 5.185 4.669 4.336 4.102 3.927 3.791 3.682 3.593 3.519 


18 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508 3.434 
19 8.185 5.926 5.010 4.500 4.171 3.939 3.765 3.631 3.523 3.434 3.360 


20 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368 3.294 
21 8.017 5.780 4.874 4.369 4.042 3.812 3.640 3.506 3.398 3.310 3.236 
22 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258 3.184 
23 7.881 5.664 4.765 4.264 3.939 3.710 3:539 3.406 3.299 Jall 3.137 
24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 3.094 
25 7.770 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129 3.056 
26 7.721 5.526 4.637 4.140 3.818 3.591 3.421 3.288 3.182 3.094 3.021 
27 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062 2.988 
28 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.120 3.032 2.959 
29 7.598 5.420 4.538 4.045 3.725 3.499 3.330 3.198 3.092 3.005 2.931 
30 7.562 5.390 4.510 4.018 3.699 3.473 3.304 3.173 3.067 2.979 2.906 
31 7.530 5.362 4.484 3.993 3.675 3.449 3.281 3.149 3.043 2.955 2.882 
32 7.499 5.336 4.459 3.969 3.652 3.427 3.258 3.127 3.021 2.934 2.860 
33 7.471 5:312 4.437 3.948 3.630 3.406 3.238 3.106 3.000 2.913 2.840 
34 7.444 5.289 4.416 3.927 3.611 3.386 3.218 3.087 2.981 2.894 2.821 
35 7.419 5.268 4.396 3.908 3.592 3.368 3.200 3.069 2.963 2.876 2.803 
36 7.396 5.248 4.377 3.890 3.574 3.351 3.183 3.052 2.946 2.859 2.786 
37 7.373 5.229 4.360 3.873 3.558 3.334 3.167 3.036 2.930 2.843 2.770 
38 7.353 5.211 4.343 3.858 3.542 3:319 3.152 3.021 2.915 2.828 2.755 
39 7.333 5.194 4.327 3.843 3.528 3.305 3.137 3.006 2.901 2.814 2.741 
40 7.314 5.179 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801 2.727 
50 7.171 5.057 4.199 3.720 3.408 3.186 3.020 2.890 2.785 2.698 2.625 
60 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.718 2.632 2.559 
70 7.011 4.922 4.074 3.600 3.291 3.071 2.906 2.777 2.672 2.585 2.512 
80 6.963 4.881 4.036 3.563 3.255 3.036 2.871 2.742 2.637 2.551 2.478 
90 6.925 4.849 4.007 3.535 3.228 3.009 2.845 2.715 2.611 2.524 2.451 
100 6.895 4.824 3.984 3.513 3.206 2.988 2.823 2.694 2.590 2.503 2.430 
110 6.871 4.803 3.965 3.495 3.188 2.970 2.806 2.677 2.573 2.486 2.413 
120 6.851 4.787 3.949 3.480 3.174 2.956 2.792 2.663 2.559 2.472 2.399 
200 6.763 4.713 3.881 3.414 3.110 2.893 2.730 2.601 2.497 2.411 2.338 


500 6.686 4.648 3.821 3.357 3.054 2.838 2.675 2.547 2.443 2.356 2.283 
L I HTA OA EOS Ei) e A 2.390 2.289 


TABLAS 


n q 12 13 14 15 20 24 30 40 60 120 500 


1 6106.321 6125.865 6142.674 6157.285 6208.730 6234.631 6260.649 6286.782 6313.030 6339.391 6359.501 
2 99.416 99.422 99.428 99.433 99.449 99.458 99.466 99.474 99.482 99.491 99.497 
3 27.052 26.983 26.924 26.872 26.690 26.598 26.505 26.411 26.316 26.221 26.148 
4 14.374 14.307 14.249 14.198 14.020 13.929 13.838 13.745 13.652 13.558 13.486 
5 9.888 9.825 9.770 9.722 9.553 9.466 9.379 9.291 9.202 9.132 9.042 
6 7.718 7.657 7.605 7.559 7.396 7.313 7.229 7.143 7.057 6.969 6.902 
7 6.469 6.410 6.359 6.314 6.155 6.074 2.992 5.908 5.824 5.737 5.671 
8 5.667 5.609 9399 5.515 5.359 5.279 5.198 5.116 5.032 4.946 4.880 


9 5.111 5.055 5.005 4.962 4.808 4.729 4.649 4.567 4.483 4.398 4.332 
10 4.706 4.650 4.601 4.558 4.405 4.327 4.247 4.165 4.082 3.996 3.930 
11 4.397 4.342 4.293 4.251 4.099 4.021 3.941 3.860 3.776 3.690 3.624 
12 4.155 4.100 4.052 4.010 3.858 3.780 3.701 3.619 3,335 3.449 3.382 
13 3.960 3.905 3.857 3.815 3.665 3.587 3.507 3.425 3.341 3.255 3.187 
14 3.800 3.745 3.698 3.656 3.505 3.427 3.348 3.266 3.181 3.094 3.026 
15 3.666 3.612 3.564 3.522 3.372 3.294 3.214 3.132 3.047 2.959 2.891 
16 3:553 3.498 3.451 3.409 3.259 3.181 3.101 3.018 2.933 2.845 2.775 
17 3.455 3.401 3.353 3.312 3.162 3.084 3.003 2.920 2.835 2.746 2.676 
18 3.371 3.316 3.269 3.227 3.077 2.999 2.919 2.835 2.749 2.660 2.589 
19 3:297 3.242 24195 3.153 3.003 2:925 2.844 2.761 2.674 2.584 : 2,512 
20 3.231 3.177 3.130 3.088 2.938 2.859 2.778 2.695 2.608 2.517 . 2.445 
21 3173 3413 3.072 3.030 2.880 2.801 2.720 2.636 2.548 2.457 2.384 
22 3.121 3.067 3.019 2.978 2.827 2.749 2.667 2.583 2.495 2.403 2.329 
23 3.074 3.020 2.973 2.931 2.781 2.702 2.620 2.535 2.447 2.354 2.280 
24 3.032 2.977 2.930 2.889 2.738 2.659 2.577 2.492 2.403 2.310 2.239 
25 2.993 2.939 2.892 2.850 2.699 2.620 2.538 2.453 2.364 2.270 2.194 
26 2.958 2.904 2.857 2.815 2.664 2.585 2.503 2.417 2.327 2.233 2.156 
27 2.926 2.871 2.824 2.783 2.632 2.552 2.470 2.384 2.294 2.198 2.122 
28 2.896 2.842 2.795 2.753 2.602 2.522 2.440 2.354 2.263 2.167 2.090 
29 2.868 2.814 2.767 2.726 2.574 2.495 2.412 2.325 2.234 2.138 2.060 
30 2.843 2.789 2.742 2.700 2.549 2.469 2.386 2.299 2.208 2.111 2.032 
31 2.820 2.765 2.718 2.677 2.525 2.445 2.362 2.273 2.183 2.086 2.006 
32 2.798 2.744 2.696 2.655 2.503 2.423 2.340 2.252 2.160 2.062 1.982 
33 DIAL 2.723 2.676 2.634 2.482 2.402 2.319 2.231 2.139 2.040 1.959 
34 2.758 2.704 2.657 2.615 2.463 2.383 2.299 2.211 2.118 2.019 1.938 
ón 2.740 2.686 2.639 2.597 2.445 2.364 2.281 2.193 2.099 2.000 1.918 
36 2.723 2.669 2.622 2.580 2.428 2.347 2.263 2.175 2.082 1.981 1.899 
37 2.707 2.653 2.606 2.564 2.412 2.331 2.247 2.159 2.065 1.964 1.881 
38 2.692 2.638 2.591 2.549 2.397 2.316 2.232 2.143 2.049 1.947 1.864 
39 2.678 2.624 2.577 2.535 2.382 2.302 2.217 2.128 2.034 1.932 1.848 
40 2.665 2.611 2.563 2.522 2.369 2.288 2.203 2.114 2.019 1.917 1.833 
50 2.562 2.508 2.461 2.419 2.265 2.183 2.098 2.007 1.909 1.803 1713 
60 2.496 2.442 2.394 2.352 2.198 2.115 2.028 1.936 1.836 1.726 1.633 
70 2.450 2.395 2.348 2.306 2.150 2.067 1.980 1.886 1.785 1.672 1.574 
80 2.415 2.361 2.319 2.271 2.115 2.032 1.944 1.849 1.746 1.630 1.530 
90 2.389 2.334 2.286 2.244 2.088 2.004 1.916 1.820 1.716 1.598 1.494 

100 2.368 2.313 2.265 2.223 2.067 1.983 1.893 1.797 1.692 1.572 1.466 
110 2.350 2.296 2.248 2.206 2.049 1.965 1.875 1.778 1.672 1.551 1.442 
120 2.336 2.282 2.234 2,192 2.035 1.950 1.860 1.763 1.656 1.533 1.421 
200 2.279 2.220 2:172 2.129 1:971 1.886 1.794 1.694 1.583 1.453 1.328 


500 2.220 2.166 2.117 2.075 1.915 1.829 1.735 1.633 1.517 1,974 1.232 
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IVIÉTODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


n(n+1) 


Tabla J. Valores seleccionados de la distribución de Mann Whitney. Para T, = 5 R(X,)- tales que: 


(nm) 


, la tabla da valores T 


i=] 


P(T, >T wm )= 4; (a =0.001, 0.005, 0.01,0.025, 0.05, 0.10) para diferentes valores de 7 y m, los tamaños de las muestras. 


Para obtener valores en la cola izquierda use: T na =2m=T ar 


i g a” 
m 


w E ARE LEE O TL E AE e w 19 20 
0.001 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 
0.005 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 37 39 

a 0.010 4 6 8 10 12 14 16 18 20 22 24 25 27 29 31 33 35 36 38 
0.025 4 6 8 10 12 14 15 17 19 21 22 24 26 28 30 31 33 35 37 
0.050 4 6 8 9 1l 13 14 16 18 20 21 23 24 26 28 30 31 33 35 
0.100 4 5 7 8 10 12 13 15 16 18 19 21 22 24 26 > 29 30 32 
0.001 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 50 53 56 59 
0.005 6 9 12 15 18 21 24 26 29 32 34 37 40 42 45 48 51 53 56 

3 0.010 6 23 B © B 2 B 25 28 31 33 36 39 41 44 46 49 52 54 
0.025 6 3 12 14 16 19 21 24 26 29 31 34 36 39 4l 44 46 49 51 
0.050 6 8 1 B 15 18 20 22 25 27 30 32 34 37 39 41 44 46 48 
0.100 39 7 10 12 14 16 18 21 23 25 27 29 31 34 36 38 40 4 44 
0.001 8 12 16 20 24 28 32 36 39 43 47 50 54 58 61 65 68 72 76 
0.005 8 12 16 20 23 27 30 34 37 41 44 48 51 54 58 6l 65 68 71 

4 0.010 8 12 16 19 22 26 29 32 36 39 42 46 49 52 56 59 62 66 69 
0.025 8 12 15 18 21 24 27 31 34 37 40 43 46 49 52 56 59 6 65 
0.050 8 11 14 17 20 23 26 29 32 35 38 41 44 47 49 52 55 58 el 
0.100 7 10 12 15 18 21 2 26 29 32 35 38 40 43 46 49 51 54 57 
0.001 10 15 20 25 30 35 39 43 48 52 57 61 66 70 74 7m g g7 
0.005 10 15 20 24 28 33 37 4 45 49 53 57 62 66 70 7 78 82 86 

5 0919 10 15 19 23 27 31 35 39 43 47 51 5 59 63 6 71 75 79 83 
0.025 10 14 18 22 26 29 33 37 4l 45 48 52 56 60 64 67 71 75 79 
0.050 2 13 17 20 24 28 31 35 38 42 46 49 53 56 60 64 67 7 74 
0.100 8 12 15 19 22 26 29 32 36 39 42 46 49 52 56 59 62 66 69 


0.001 20 30 39 48 56 64 73 81 89 97 105 112 120 128 136 144 152 160 167 
0.005 20 29 37 45 53 60 68 76 83 91 98 105 113 120 128 135 142 150 157 
0.010 20 28 36 43 51 58 66 73 80 87 95 102 109 116 123 131 138 145 152 
0.025 19 26 34 41 48 55 62 69 76 83 90 9 103 110 117 124 131 137 144 
0.050 18 25 32 38 45 52 59 65 72 78 85 9 98 105 111 118 124 131 137 
0.100 16 23 29 36 42 48 55 6l 67 73 80 86 92 98 105 111 117 123 129 
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Tabla J. (Continuación) 


n 


12 


13 


14 


15 


16 


17 


19 


20 


a 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.010 
0.025 
0.050 
0.100 


0.001 
0.005 
0.01 
0.025 
0.05 
0.1 


2 


131 


101 
142 


109 
152 


118 
163 


126 
173 


135 
184 


143 
194 


152 
205 
186 


160 
215 


168 
225 


177 


165 
155 
150 
142 
136 
128 


178 
168 
162 
154 
147 
138 


191 
180 
174 
166 
158 
149 


205 
193 
186 
177 
169 
160 


218 
205 
199 
189 
181 
171 


231 
217 
211 
201 
192 
181 


244 
230 
223 
212 
203 
192 


257 
242 
235 
224 
214 
203 


270 
254 
247 
235 
225 


pas 


213 


283 
267 
259 
247 
236 
224 


182 
171 
166 
157 
150 
141 


197 
185 
179 
170 
162 
153 


211 
199 
192 
183 
175 
165 


225 
212 
206 
196 
187 
177 


240 
226 
219 
209 
199 
189 


254 
240 
232 
221 
212 
200 


269 
253 
246 
234 
224 
212 


283 
267 
259 
247 
236 
224 


297 
280 
272 
260 
249 
236 


311 
294 
285 
272 
261 
248 


TABLAS 


METODOS ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla K. Valores seleccionados de la distribución de la estadística de Kruskal Wallis para 3 tratamientos y tamaños de muestra menores o 
iguales que cinco. 
Para 2,, 2, y nz dados, la tabla da la probabilidad (p) de un valor mayor que 7 (la estadística de Kruskal Wallis) si la hipótesis 
nula es cierta. 


ny M M3 T P n h h T P n tt m T P 


2 1 1 2700 0.500 4 2 2 6000 0.014 4 4 2 7.855 0.002 
1.800 0.833 5.500 0.024 7.036 0.006 
5.333 0.033 6.873 0.011 
2 2 1 3.600 0.200 5.125 0.052 6.082 0.025 
3.000 0.333 4.458 0.100 5.454 0.046 
2.400 0.467 4.167 0.105 5.236 0.052 
4.773 0.075 
2 2 2 4.571 0.067 4 3 1 5.833 0.021 4.554 0.098 
3.714 0.200 5.389 0.036 4.446 0.103 
3.429 0.333 5.208 0.050 4.418 0.120 
4.764 0.071 4.009 0.142 
3 1 1 3.200 0.300 4.097 0.086 
2.133 0.700 4.056 0.093 4 4 3 8.909 0.001 
3.889 0.129 7.598 0.004 
3 2 1 4286 0.100 3.764 0.136 7.477 0.006 
3.857 0.133 7.144 0.010 
3.524 0.200 4 3 2 7.000 0.005 6.394 0.025 
3.095 0.283 6.444 0.008 5.598 0.049 
2.381 0.433 6.300 0.011 5.576 0.051 
6.000 0.024 5.144 0.073 
y 2 2 ¿5357 0029 5.400 0.051 4.546 0.099 
4.714 0.048 4.811 0.076 4.477 0.102 
4.500 0.067 4.444 0.102 4.296 0.125 
4464 0.105 4.278 0.124 3.962 0.140 
4.000 0.149 3.848 0.150 
3 3 1 5.143 0.043 
4.571 0.100 4 3 3 8.018 0.001 á 4 4 9846 0.000 
4.000 0.129 7.000 0.006 8.654 0.001 
6.746 0.010 8.000 0.005 
3 S 2 6250. 00t 6.154 0.025 7.538 0.011 
5.556 0.025 5.727 0.050 6.615 0.024 
5.361 0.032 5.000 0.074 5.692 0.049 
5.139 0.061 4.700 0.101 5.654 0.055 
5.000 0.075 4.091 0.126 5.115 0.074 
4.556 0.100 3.386 0.150 4.654 0.097 
4.250 0.121 4.500 0.104 
4.111 0.129 4 4 1 6.667 0.010 4.269 0.122 
6.167 0.022 3.962 0.145 
3 3 3 7.200 0.004 4.967 0.048 
6.489 0.011 4.867 0.054 5 1 1 3.857 0.143 
5.956 0.025 4.267 0.070 2.829 0.333 
5.600 0.050 4.167 0.083 
5.422 0.071 4.067 0.102 5 2 1 5250 0.036 
4.622 0.100 3.900 0.108 5.000 0.048 
4.267 0.139 3.867 0.121 4.450 0.071 
4.200 0.095 
4 1 1 3.571 0.200 4.050 0.110 
2.500 0.467 3.783 0.131 
4 2 1 4.821 0.057 
4.500 0.076 
4.018 0.114 


ni 


m 


n3 


A 


n 


n3 


TABLAS 


Meronos ESTADÍSTICOS - UN ENFOQUE INTERDISCIPLINARIO 
Infante-Gil y Zárate de Lara 


Tabla L. Valores seleccionados de la distribución de la estadística de rangos con signo de Wilcoxon. 
Para & = 0.005, 0.01, 0.0025, 0.05, 0.10, 0.20, 0.30, 0.40, 0.50, la tabla da los valores de T» tales que bajo la hipótesis nula: 


P(T>T)=ú, 


donde Tes ka estadística de Wilcoxon. 
Para valores en la cola izquierda de la distribución use la ecuación: 


AMD) 


0.005 0.010 0.025 0.050 0.100 0.200 


0.300 0.400 0.500 


Tabla M. Valores seleccionados de la distribución de la estadística 
de Friedman. 
La tabla presenta, para £ tratamientos y $ bloques, la 
probabilidad (p) de un valor mayor o igual que 7 (la 
estadística de Friedman) si la hipótesis nula es cierta. 


tb T $ t b T p 
3 2 4000 0.167 3 8 12.000 0.001 
3.000 0.500 9.750 0.005 
9.000 0.010 
3 3 6.000 0.028 6.250 0.047 
4.667 0.194 5.250 0.079 
2.667 0.361 4.750 0.120 
3 4 8000 0.005 3 9 11.556 0.001 
6.500 0.042 9.556 0.006 
6.000 0.069 8.667 0.010 
4.500 0.125 6.222 0.048 
3.500 0.273 6.000 0.057 
5.556 0.069 
3 5 10.000 0.001 4.667 0.107 
8.400 0.008 
7.600 0.024 4 2 6.000 0.042 
6.400 0.039 5.400 0.167 
5.200 0.093 4.800 0.208 
4.800 0.124 
3.600 0.182 4 3 9.000 0.002 
2.800 0.367 8.200 0.017 
7.000 0.054 
3 6 10.330 0.002 6.600 0.075 
9.000 0.008 5.800 0.148 
8.330 0.012 
7.000 0.029 4 4 11.100 0.001 
6.330 0.052 9.900 0.006 
5.330 0.072 9.300 0.012 
4.330 0.142 7.500 0.052 
6.300 0.094 
3 7 11.143 0.001 6.000 0.105 
10.286 0.004 5.700 0.141 
8.857 0.008 
8.000 0.016 
6.000 0.051 
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La primera edición de la obra Métodos Estadísticos: un Enfoque 
Interdisciplinario, vio la luz en enero de 1984, agotándose su 
primer tiraje (de 3,000 ejemplares) en menos de seis meses. 
Desde entonces se ha reimpreso regularmente, en promedio una 
vez por año, con tirajes de entre 1,000 y 1,500 ejemplares cada 
vez. Puede decirse que, dentro de la exigua tradición de la 
literatura científica en México, se ha convertido en un clásico en el 
que han abrevado ya 29 cohortes de estudiantes de licenciatura, 
maestría y doctorado de México, Centro y Sudamérica, y del 
suroeste de los EE UU. 


Esta tercera edición, ahora bajo el sello editorial del Colegio de 
Postgraduados, incluye varias novedades; entre ellas la 
posibilidad de usar el paquete R (de libre acceso) para trabajar los 
ejemplos en el texto y los ejercicios al final de cada capítulo. 
Seguramente este libro seguirá siendo una referencia adecuada 
para todo estudiante de ciencias experimentales y sociales. 
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